데이터분석 (2) 썸네일형 리스트형 [python] 데이터프레임 중복 행 제거 중복값을 넣어 데이터프레임을 만들어주었습니다. 📌 중복 값 확인 # df의 중복값 확인 df.duplicated() 결과값은 True / False로 도출되고 중복값에서 True로 표기가 됩니다. 📌 중복 행 제거 # 중복행 제거 df.duplicates() df.duplicates()에서 True로 나온 행이 삭제된 것을 확인할 수 있습니다. 📌 특정열에서 중복된 행 제거 df.drop_duplicates("특정열") season의 중복값이 제거되어 spring, summer, autumn winter만 남았습니다. # 참고로 저건 결과를 보여주기만 한 것이기 때문에 저대로 데이터프레임을 만들고 싶다면 선언을 해주어야합니다. df = df.drop_duplicates('season') 이런식으로요!! [데이터 분석] 통계 기반 분석 모형 📌 기술 통계 (Descriptive Statistics) - 확률ㆍ통계적으로 정리ㆍ요약하는 기초적 통계 - 평균, 분산, 표준편차, 왜도와 첨도, 빈도 등 데이터에 대한 대략적 통계적 수치를 계산하고 도출 - 그래프를 활용하여 데이터 파악 - 데이터 분포의 특징 파악 📌 상관 분석 (Correlation Analysis) - 두 개 이상의 변수 간에 존재하는 상호 연관성의 정도를 측정하여 분석하는 방법 ① 단순상관 분석 : 두 변수 사이의 연관 관계 분석 ② 다중상관 분석 : 셋 이상의 변수들 사이의 연관 정도 분석 ③ 변수 간 상관 분석 : 데이터의 속성(수치적, 명목적, 순서적)에 따른 변수 간 분석 📌 회귀 분석 (Regression Analysis) - 하나 이상의 독립변수들이 종속변수에 미치는.. 이전 1 다음