본문 바로가기

pandas

(3)
[Python] invalid literal for int() with base 10: '' 해결 데이터를 전처리 하는데 저 오류를 만났다... 내가 하려고 했던 연산은 각 칼럼의 값을 모두 더하여 새로운 칼럼을 만드는 것이었다. 그리고 연산을 했을 때 invalid literal for int() with base 10: '' 오류가 뜨길래 데이터 타입을 확인해본 결과, 음 col1과 col3이 object형으로 되어있었다. 평소처럼 astype을 이용하여 형 변환을 시도하였다. df['col1'].astype('float') df['col3'].astype('float') ####################################### df.astype({'col1': 'int','col3':'int'}) .....행복하다ㅎ...새로운 방법을 찾아 나설 수 있는.. 기회를 주시다니.......
[python] pandas의 loc, iloc 사용법 loc과 iloc을 사용하여 필요한 데이터를 추출해보겠습니다. 일단 둘의 차이는 아래 링크에 써두었습니다. 참고하실 분들은 참고해주세요! [python] pandas의 loc, iloc 차이 📌 df.loc[인덱스] : 인덱스 행 데이터 가져오기 📌 df.iloc[행 위치] : 행 위치에 해당하는 데이터 가져오기 그렇다면 인덱스와 행 번호는 무슨 차이일까요? sklearn의 아이리스 데이터를 이용하여 예 puddle-of-devstory.tistory.com 데이터 프레임에서 원하는 값 하나만을 추출하려면 어떤 방법이 있을까요? 📌 df.loc[인덱스 번호, 열 이름] 📌 df.iloc[행 위치, 열 위치] 아이리스 데이터로 예를 들어보겠습니다. loc과 iloc을 이용하여 빨간 박스의 값을 찾겠습니다...
[python] pandas의 loc, iloc 차이 📌 df.loc[인덱스] : 인덱스 행 데이터 가져오기 📌 df.iloc[행 위치] : 행 위치에 해당하는 데이터 가져오기 그렇다면 인덱스와 행 번호는 무슨 차이일까요? sklearn의 아이리스 데이터를 이용하여 예를 들어보겠습니다. 파이썬 기준으로 3번째 행을 삭제했을 경우 데이터 프레임은 다음과 같이 나타납니다. 빨간 박스는 '인덱스 번호'입니다. 📌 인덱스는 데이터에 고유 값으로 정해지기 때문에 데이터를 삭제해도 바뀌지 않습니다. 하지만 행 번호 위치 값에 따라 바뀝니다. 즉, 인덱스 번호는 여전히 (0,1,2,4,5) 이지만 행 번호는 (0,1,2,3,4) 입니다. loc을 이용하여 3번을 추출해보면 어떻게 나올까요? df_iris.loc[3] KeyError가 나타났습니다. 3번 인덱스가 없기 ..