AI/Pandas

[Pandas] groupby

sangwonYoon 2023. 3. 9. 01:21

DataFrame에서 특정 column의 값을 기준으로 그룹을 짓는 방법에 대해 알아보자.


groupby

  • SQL의 GROUP BY와 같은 역할을 한다.
  • 그룹을 짓는 기준이 되는 column을 지정해서 데이터를 그룹별로 나눈다.
데이터프레임.groupby(기준 column).연산()
df = pd.DataFrame({
    'city': ['부산', '부산', '부산', '부산', '서울', '서울', '서울'],
    'fruits': ['apple', 'orange', 'banana', 'banana', 'apple', 'apple', 'banana'],
    'price': [100, 200, 250, 300, 150, 200, 400],
    'quantity': [1, 2, 3, 4, 5, 6, 7]
})

print(df.groupby("fruits")["quantity"].sum()) # 각 그룹의 quantity 열의 총합
# 출력:
# fruits
# apple     12
# banana    14
# orange     2
# Name: quantity, dtype: int64