본문 바로가기

DATA/Python

[python] 데이터프레임 중복 행 제거

중복값을 넣어 데이터프레임을 만들어주었습니다.

 

📌 중복 값 확인

# df의 중복값 확인
df.duplicated()

결과값은 True / False로 도출되고 중복값에서 True로 표기가 됩니다.

 

 

📌 중복 행 제거

# 중복행 제거
df.duplicates()

df.duplicates()에서 True로 나온 행이 삭제된 것을 확인할 수 있습니다. 

 

 

📌 특정열에서 중복된 행 제거

df.drop_duplicates("특정열")

season의 중복값이 제거되어 spring, summer, autumn winter만 남았습니다.

 

# 참고로 저건 결과를 보여주기만 한 것이기 때문에 저대로 데이터프레임을 만들고 싶다면 선언을 해주어야합니다.

df = df.drop_duplicates('season') 이런식으로요!!