DataFrame에서 특정 column의 값을 기준으로 그룹을 짓는 방법에 대해 알아보자.
groupby
- SQL의 GROUP BY와 같은 역할을 한다.
- 그룹을 짓는 기준이 되는 column을 지정해서 데이터를 그룹별로 나눈다.
데이터프레임.groupby(기준 column).연산()
df = pd.DataFrame({
'city': ['부산', '부산', '부산', '부산', '서울', '서울', '서울'],
'fruits': ['apple', 'orange', 'banana', 'banana', 'apple', 'apple', 'banana'],
'price': [100, 200, 250, 300, 150, 200, 400],
'quantity': [1, 2, 3, 4, 5, 6, 7]
})
print(df.groupby("fruits")["quantity"].sum()) # 각 그룹의 quantity 열의 총합
# 출력:
# fruits
# apple 12
# banana 14
# orange 2
# Name: quantity, dtype: int64
'AI > Pandas' 카테고리의 다른 글
[Pandas] 연속형 데이터를 범주형 데이터로 변환하는 방법 (0) | 2023.03.09 |
---|---|
[Pandas] DataFrame을 합치는 방법 (0) | 2023.03.09 |
[Pandas] column 별로 데이터의 비율 알아내는 방법 (0) | 2023.03.09 |
[Pandas] DataFrame 출력할 때 보여지는 데이터 개수 늘리는 방법 (0) | 2023.03.09 |
[Pandas] apply 함수와 applymap 함수 (0) | 2023.03.09 |