본문 바로가기

분류 전체보기

(38)
[Python] invalid literal for int() with base 10: '' 해결 데이터를 전처리 하는데 저 오류를 만났다... 내가 하려고 했던 연산은 각 칼럼의 값을 모두 더하여 새로운 칼럼을 만드는 것이었다. 그리고 연산을 했을 때 invalid literal for int() with base 10: '' 오류가 뜨길래 데이터 타입을 확인해본 결과, 음 col1과 col3이 object형으로 되어있었다. 평소처럼 astype을 이용하여 형 변환을 시도하였다. df['col1'].astype('float') df['col3'].astype('float') ####################################### df.astype({'col1': 'int','col3':'int'}) .....행복하다ㅎ...새로운 방법을 찾아 나설 수 있는.. 기회를 주시다니.......
[Python] 날짜형 정리 datetime, date, timestamp 데이터를 분석하면서 날짜 데이터를 다루는 일이 많았는데, 정말 에러를 많이 만난 것 같다. TypeError: can't compare datetime.datetime to datetime.date 둘 다 날짜형인데 datetime.datetime 과 datetime.date를 비교 못한다니...! 예시는 저것만 써놓았지만 그동안 만난 에러는 더 많다. 날짜형 데이터 처리하느라 날짜형을 문자형으로도 바꿔보고 문자형을 날짜형으로도 바꾸고 별 짓을 다 하였다. 근본을 모르니까 오류를 만날 때마다 헤매는 일이 다반사였다. 따라서 근본을 알아야겠다고 다짐하였고 내가 보려고 쓰는 Python의 날짜형 데이터 정리 시작 Python의 날짜형은 ①datetime ②date ③timestamp이 있다 날짜형이 다르면 ..
[Python] strptime, strftime 차이점 1. strftime (datetime → str) datetime을 문자열로 변환하고 싶을 때 strftime 사용 날짜형에서 strftime을 사용하여 문자형으로 변환된 것을 알 수 있음 # 문자형으로 바뀐 날짜형 데이터 도출 '날짜형데이터'.strftime('날짜형식') 2. strptime (str → datetime) 문자열을 dateitme으로 변환하고 싶을 때 strptime 사용 문자형에서 strptime을 이용하여 날짜형으로 변환된 것을 알 수 있음 # 날짜형으로 바뀐 문자형 데이터 datetime.datetime.strptime('문자형데이터', '날짜형식')
CSS란? 보호되어 있는 글입니다.
HTML이란? 보호되어 있는 글입니다.
HTTP와 HTTPS 개념과 대칭키, 비대칭키 사용 📌HTTP (Hyper Text Transfer Protocol) - 서버/클라이언트 모델을 따라 데이터를 주고 받기 위한 프로토콜 → HTTP는 암호화가 되지 않은 평문 데이터를 전송하는 프로토콜이기 때문에 보안에 취약 # 하이퍼 텍스트 : 문서 중간 중간 특정 키워드를 두고 문자나 그림을 상호 유기적으로 결합하여 연결시켜서 서로 다른 문서여도 하나의 문서인 것처럼 보이면서 참조하기 쉽도록 하는 방식 # 프로토콜 : 통신 시스템이 데이터를 교환하기 위해 사용하는 통신 규칙 📌HTTPS (Hyper Text Transfer Protocol Secure) - HTTP에 데이터 암호화, 복호화가 추가된 프로토콜 - 대칭키 암호화 방식과 비대칭키 암호화 방식 모두 사용 - 안전하게 데이터 교환 가능하며 HTT..
[ML] 데이터 정규화, 표준화의 차이와 하는 이유 📌 데이터 스케일링 : 데이터 표준화 or 정규화하여 데이터셋을 정제하는 것 ▶ 왜 필요할까 ? 특성들의 단위가 모두 다르고, 범위도 다르기 때문에 직접적으로 비교할 수 없다 따라서 각 특성들의 단위를 무시하고 단순 비교할 수 있게 만들어준다 ex) 토익 750점 vs 영어 모의고사 80점 → 누가 더 영어 잘하는지 판단하기 어려움 또한 범위(scale)가 너무 크면 노이즈 데이터가 생성되거나 오버피팅될 가능성이 높아져서 이를 방지하기 위해 진행한다 📌 정규화 : 값의 범위를 0~1 사이의 값으로 바꿔준다 - 데이터의 여러 특성(칼럼) 값이 평등하게 0~1사이로 바뀌기때문에 기계가 평등하게 학습할 수 있다 - scikit-learn에서 MinMaxScaler 사용 📌 표준화 : 데이터가 정규분포를 따른다..
[PostgreSQL] 데이터 삽입 / 행 추가 CREATE TABLE cafe_blog ( search_word text, blog_posting int, cafe_posting int ); 로 구성된 테이블이 있다고 예를 들면 여러가지 방법으로 데이터를 추가할 수 있다. 1. 칼럼을 따로 지정 안하고 전체 데이터 칼럼 순서대로 넣기 INSERT INTO cafe_blog VALUES ('축구', 150000, 200000); 2. 칼럼 지정 후 해당 칼럼에만 데이터 넣기 INSERT INTO cafe_blog (search_word, cafe_posting) VALUES ('축구', 150000); 3. 여러 행 한 번에 삽입하기 INSERT INTO cafe_blog (blog_posting, search_word) VALUES ( 152300,..