본문 바로가기
반응형

전체 글108

[파이썬 사이킷런 딥러닝] 분류 예제 (make_moons) make_moons 데이터셋을 이용한 딥러닝 예제입니다. 데이터셋은 좌표 데이터구요. 각 데이터마다 0 또는 1의 라벨이 붙어있습니다. 데이터를 입력하면 0 또는 1로 분류해주는 신경망을 만드는 것이 목적입니다. 총 1000개의 데이터를 만들거구요. 750개를 훈련에 쓰고 250개는 테스트에 사용할 것입니다. 전체 과정은 아래와 같이 요약됩니다. 1. 패키지 설치 패키지가 설치되어 있지 않다면 콘솔에서 아래 피키지들을 설치합니다. pip install sklearn pip install scikit-neuralnetwork pip install matplotlib pip install pandas pip install numpy 2. 패키지 불러오기 사용할 패키지들을 불러옵니다. 코드는 아래와 같습니다... 2022. 11. 2.
[파이썬 머신러닝, k최근접 이웃] 4. 모델 학습과 평가 데이터를 불러와서 훈련데이터와 테스트데이터로 나누는 코드는 아래와 같습니다. from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split #1.데이터 불러오기 md=load_iris() #key:value 형태의 bunch 클래스, 딕셔너리와 비슷함 #2.데이터 분리해서 변수에 넣기 data_train,data_test,target_train,target_test=train_test_split(md['data'],md['target'],random_state=0) 오늘은 k 최근접이웃 알고리즘을 사용하여 머신러닝 모델을 만들어봅시다. 함수를 불러오고, 모델을 생성합니다. from sklearn.neig.. 2022. 3. 24.
[파이썬 머신러닝, k최근접 이웃] 3. 산점도행렬 그려보기 y값이 입력변수들에 의해 구분되어 있는지를 시각적으로 확인해보기 위해 산점도행렬을 그려봅시다. 지난시간에 만든 data_train이 입력변수입니다. >>> data_train[:5] array([[5.9, 3. , 4.2, 1.5], [5.8, 2.6, 4. , 1.2], [6.8, 3. , 5.5, 2.1], [4.7, 3.2, 1.3, 0.2], [6.9, 3.1, 5.1, 2.3]]) 4열짜리 배열인데요. 판다스의 데이터프레임으로 바꿔야 산점도행렬을 그릴 수가 있습니다. 아래와 같이 바꿉니다. df_data_train=pd.DataFrame(data_train) >>> df_data_train[:5] 0 1 2 3 0 5.9 3.0 4.2 1.5 1 5.8 2.6 4.0 1.2 2 6.8 3.0 5.. 2022. 3. 17.
[파이썬 머신러닝, k최근접 이웃] 2. 트레이닝셋, 테스트셋 나누기 우리에게는 150개의 붓꽃 데이터가 있습니다. 만약 150개 데이터 전체를 가지고 모델을 만든다면, 이 모델을 평가해볼 수가 없습니다. 따라서 150개의 데이터를 모델을 만들 데이터와 모델을 평가할 데이터로 나누도록 하겠습니다. 모델을 만드는데 사용되는 데이터를 training set, 모델을 평가하는데 사용되는 데이터를 test set 라고 부릅니다. 일반적으로 전체 데이터의 25%를 test set 으로 사용합니다. 다행히 사이킷런 패키지에는 알아서 training set 과 test set 을 나눠주는 함수가 있습니다. train_test_split 이라는 함수입니다. 한번 사용해봅시다. 아래와 같은 형식으로 사용합니다. 함수를 따로 import 해주어야 합니다. from sklearn.datase.. 2022. 3. 12.
반응형