그룹별 집계함수 적용

하나의 통계치

df.groupby('group_id')['value'].sum().reset_index(name = 'value_sum')
 
df.groupby('group_id').agg({'value':'sum'}).reset_index()

산출할 통계치 여러개인 경우

  • 그룹별 집계 항목 여러개인 경우
    • 그룹 id에 대해서 col1, col2의 평균, 표준편차, 최대값, 최소값을 각각 구하는 방법
import pandas as pd
 
df.groupby(['group_id']).agg({'col_nm1': ['mean', 'std', 'max', 'min'],
							 'col_nm2': ['mean', 'std', 'max', 'min']}).reset_index()