[python] 데이터 프레임 열 이름 / 순서 바꾸기
데이터프레임을 불러왔을 때 열 이름 및 순서를 변경하는 방법 먼저 임의로 데이터 프레임을 만들었습니다. df = pd.DataFrame({ 'name':['봄','여름','가을','겨울'], 'score':[100,20,90,60], 'number':[1,2,3,4]}) 📌 열 순서 바꾸기 number, name, score 순으로 바꾸겠습니다. df = df[['number','name', 'score']] 📌 열 이름 바꾸기 name을 season으로 변경하겠습니다. df = df.rename(columns={'name':'season'})
[python] pandas의 loc, iloc 차이
📌 df.loc[인덱스] : 인덱스 행 데이터 가져오기 📌 df.iloc[행 위치] : 행 위치에 해당하는 데이터 가져오기 그렇다면 인덱스와 행 번호는 무슨 차이일까요? sklearn의 아이리스 데이터를 이용하여 예를 들어보겠습니다. 파이썬 기준으로 3번째 행을 삭제했을 경우 데이터 프레임은 다음과 같이 나타납니다. 빨간 박스는 '인덱스 번호'입니다. 📌 인덱스는 데이터에 고유 값으로 정해지기 때문에 데이터를 삭제해도 바뀌지 않습니다. 하지만 행 번호 위치 값에 따라 바뀝니다. 즉, 인덱스 번호는 여전히 (0,1,2,4,5) 이지만 행 번호는 (0,1,2,3,4) 입니다. loc을 이용하여 3번을 추출해보면 어떻게 나올까요? df_iris.loc[3] KeyError가 나타났습니다. 3번 인덱스가 없기 ..