사이킷런 fit_transform, fit, transform
sklearn에서의 fit과 transform fit : 학습하다(기억하다) transform : 변환하다(적용하다) 잘못된 학습 방법 (fit_transform을 훈련,테스트셋에 적용) ⚠ 문제점 훈련 데이터와 테스트 데이터에서 각각 fit()을 실행 → 훈련 데이터에서 구한 중앙값 ≠ 테스트 데이터에서 구한 중앙값 → 서로...
sklearn에서의 fit과 transform fit : 학습하다(기억하다) transform : 변환하다(적용하다) 잘못된 학습 방법 (fit_transform을 훈련,테스트셋에 적용) ⚠ 문제점 훈련 데이터와 테스트 데이터에서 각각 fit()을 실행 → 훈련 데이터에서 구한 중앙값 ≠ 테스트 데이터에서 구한 중앙값 → 서로...
서론 학습로그를 처음 작성하기에 앞서, 내가 수업시간에 헷갈리던 부분이 무엇인가 작성한 코랩 파일을 하나씩 보며 되짚어봤다. 여러가지가 있었지만… 그 중에서도 잘 이해가 되지 않았던 stack과 melt가 눈에 들어왔다. 중요한 집계 파트이기도 했고, melt가 중요하다고 말씀하신 거 같았기에, 이번 기회에 확실히 개념을 잡고 넘어가면 좋을 거 같...
use analyze_db; SELECT * FROM TB_POPLTN_DATA; # Data Warehouse -- 컬럼 레벨에 집계의 기준이 있으면 그 데이터는 집계가 불가능!!! -- 컬럼은 항목을 분류하기 위해 만드는 거지 !! INSERT INTO TB_POPLTN SELECT A.ADMINIST_ZONE_NO, A.ADMINIST_...
계속 계속 헷갈리는 것들 모음집,,, Pandas lambda LIst comprehension My SQL ### SELECT ISNULL IFNULL IF CASE WHEN THEN (여러개의 조건식) DISTINCT (중복된 데이터 제거) UNION 여러 개의 SELECT 결과를 세로로 합치는 연산자 ...
서론 깃허브 블로그를 작성할 떄, vscode를 통해 마크다운을 작성하는데 이미지 삽입이 복잡하다는 걸 알았다,,, 애써 이미지를 넣지 않고 작성하다 한계를 느껴, 여러 방법을 찾아보니 깃허브 페이지에서 이슈를 만들어 거기에 이미지를 복사 붙여넣기를 해서 링크를 가져오는 …? 여튼 대중적인 방법이 있는 거 같던데 마음에 들지 않았다. 더 찾아보니, p...
temperatures.csv 파일 사용 07. 날짜 데이터 가공 사전 준비 import pandas as pd df = pd.read_csv("./data/temperatures.csv") df.head() 가공할 날짜 정보가 어떤 형식인지 확인 날짜 데이터는 날짜형으로 변경해야 여러가지 날짜 계산을 할 수 있다. df.info() ...
RESTful API 크롤링 RESTful API 크롤링을 하는 이유? 아마… 실시간으로 계속 업데이트 되는 데이터는 html로 긁어올 수 없기 때문에… 좀 더 자세한 이유가 있을 거 같은데, 그건 차차 알아보기로 하자(지금은 복습 시간도 부족함) 코스피, 코스닥, USD import requests import pandas as pd 코스...
사전준비 BeautifulSoup을 불러오기 위해,,, !pip install bs4 html문자열은 파이썬에서 다뤄야 한다. BeautifulSoup을 이용하여 html을 문자열 엘리먼트 객체로 바꿀 수 있다! type이 BeautifulSoup임. 네이버 환율정보 가져오기 import requests from bs4 import B...
사전준비 import numpy as np # import matplotlib.pyplot as plt # 시각화를 위해 import seaborn as sns # 시각화를 위해 ########## 실행 후 # 한글 폰트 깨짐 방지 (시각화) !sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm...