중복값을 넣어 데이터프레임을 만들어주었습니다.
📌 중복 값 확인
# df의 중복값 확인
df.duplicated()
결과값은 True / False로 도출되고 중복값에서 True로 표기가 됩니다.
📌 중복 행 제거
# 중복행 제거
df.duplicates()
df.duplicates()에서 True로 나온 행이 삭제된 것을 확인할 수 있습니다.
📌 특정열에서 중복된 행 제거
df.drop_duplicates("특정열")
season의 중복값이 제거되어 spring, summer, autumn winter만 남았습니다.
# 참고로 저건 결과를 보여주기만 한 것이기 때문에 저대로 데이터프레임을 만들고 싶다면 선언을 해주어야합니다.
df = df.drop_duplicates('season') 이런식으로요!!
'DATA > Python' 카테고리의 다른 글
[Python] strptime, strftime 차이점 (0) | 2022.11.12 |
---|---|
[python] 데이터 프레임 열 이름 / 순서 바꾸기 (0) | 2022.04.22 |
[python] 데이터프레임 전체 출력 (0) | 2022.04.18 |
[python] pandas의 loc, iloc 사용법 (0) | 2022.04.17 |
[python] pandas의 loc, iloc 차이 (0) | 2022.04.15 |