AI/Pandas

[Pandas] 연속형 데이터를 범주형 데이터로 변환하는 방법

sangwonYoon 2023. 3. 9. 01:29

pandas 라이브러리를 활용하여 데이터를 처리할 때, 연속형 데이터를 범주형 데이터로 변환해야 하는 경우가 있다.

이런 경우, 어떤 방법으로 연속형 데이터를 범주형 데이터로 변환할 수 있는지 알아보자.


cut 함수

연속형 데이터를 잘라 범주형 데이터로 변환할 수 있다.

pd.cut(column 이름, bins=[자르려고 하는 값의 경계], labels=[각 범위에서 갖는 값]
boundary = list(range(0, int(df["age"].max()) + 10, 10))
print(boundary) # 출력: [0, 10, 20, 30, 40, 50, 60, 70, 80]

pd.cut(df.age, bins = boundary) # 나이대를 값으로 갖는 범주형 데이터가 생성된다.