pandas 라이브러리를 활용하여 데이터를 처리할 때, 연속형 데이터를 범주형 데이터로 변환해야 하는 경우가 있다.
이런 경우, 어떤 방법으로 연속형 데이터를 범주형 데이터로 변환할 수 있는지 알아보자.
cut 함수
연속형 데이터를 잘라 범주형 데이터로 변환할 수 있다.
pd.cut(column 이름, bins=[자르려고 하는 값의 경계], labels=[각 범위에서 갖는 값]
boundary = list(range(0, int(df["age"].max()) + 10, 10))
print(boundary) # 출력: [0, 10, 20, 30, 40, 50, 60, 70, 80]
pd.cut(df.age, bins = boundary) # 나이대를 값으로 갖는 범주형 데이터가 생성된다.
'AI > Pandas' 카테고리의 다른 글
[Pandas] DataFrame을 합치는 방법 (0) | 2023.03.09 |
---|---|
[Pandas] groupby (0) | 2023.03.09 |
[Pandas] column 별로 데이터의 비율 알아내는 방법 (0) | 2023.03.09 |
[Pandas] DataFrame 출력할 때 보여지는 데이터 개수 늘리는 방법 (0) | 2023.03.09 |
[Pandas] apply 함수와 applymap 함수 (0) | 2023.03.09 |