본문 바로가기
반응형

머신러닝 (지도학습)7

[로지스틱 회귀분석] 타이타닉 데이터 타이타닉 데이터를 이용하여 로지스틱 회귀분석을 수행하는 예제입니다. 단계별 수행 내용은 주석으로 달아놓았습니다. 검증은 repeated k-fold 교차검증을 사용하였습니다. import seaborn as sns import pandas as pd from sklearn.model_selection import RepeatedKFold from sklearn.linear_model import LogisticRegression from sklearn.model_selection import cross_val_score import numpy as np #1. 데이터 불러오기 dt = sns.load_dataset('titanic') #2. 나이 데이터 결측치 평균으로 대체 dt['age'].fillna.. 2023. 10. 6.
[파이썬 머신러닝] 다항 회귀분석 (보스턴 집값) 다항회귀분석은 2차 이상의 항을 포함한 비선형 회귀분석입니다. 파이썬에서 다항 회귀분석을 하는 방법을 알아봅시다. 설명은 주석에 달아놓았습니다. 절차를 간단히 설명하겠습니다. - boston 집값 데이터를 불러옴 - 독립변수 종속변수를 추출하고 데이터프레임으로 만듦 - 상관관계 행렬 그래프를 그려봄 - 데이터를 train set과 test set 으로 분할함 - 데이터를 정규화함 (min max) - 다항식을 생성함. 차수 설정 가능. - 회귀 모델을 학습함 - train 데이터로 평가함 - test 데이터로 평가함 평가지표는 mse(mean squared error), rmse, $R^2$ 입니다. import pandas as pd import numpy as np from sklearn.datase.. 2023. 9. 7.
[파이썬 머신러닝] 다중 회귀분석 (보스톤 집값) 파이썬에서 다중 회귀분석 하는 방법을 알아봅시다. 설명은 주석에 달아놓았습니다. 절차를 간단히 설명하겠습니다. - boston 집값 데이터를 불러옴 - 독립변수 종속변수를 추출하고 데이터프레임으로 만듦 - 상관관계 행렬 그래프를 그려봄 - 데이터를 train set과 test set 으로 분할함 - 데이터를 정규화함 (min max) - 회귀 모델을 학습함 - train 데이터로 평가함 - test 데이터로 평가함 평가지표는 mse(mean squared error), rmse, $R^2$ 입니다. import pandas as pd import numpy as np from sklearn.datasets import load_boston ####################################.. 2023. 9. 7.
[파이썬 머신러닝, k최근접 이웃] 4. 모델 학습과 평가 데이터를 불러와서 훈련데이터와 테스트데이터로 나누는 코드는 아래와 같습니다. from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split #1.데이터 불러오기 md=load_iris() #key:value 형태의 bunch 클래스, 딕셔너리와 비슷함 #2.데이터 분리해서 변수에 넣기 data_train,data_test,target_train,target_test=train_test_split(md['data'],md['target'],random_state=0) 오늘은 k 최근접이웃 알고리즘을 사용하여 머신러닝 모델을 만들어봅시다. 함수를 불러오고, 모델을 생성합니다. from sklearn.neig.. 2022. 3. 24.
반응형