본문 바로가기

Major Study/25-1 Machine Learning

(6)
[Machine Learning] chapter6 - 비지도 학습 1. 군집 알고리즘데이터 준비!wget https://bit.ly/fruits_300_data -O fruits_300.npyimport numpy as npimport matplotlib.pyplot as pltfruits = np.load('fruits_300.npy')print(fruits.shape)>>> (300, 100, 100) - 샘플 수 : 300, 이미지 높이 : 100, 이미지 너비 : 100plt.imshow(fruits[0], cmap='gray')plt.show()plt.imshow(fruits[0], cmap='gray_r')plt.show() - cmap 매개변수를 'gray_r'로 지정하면 색 반전이 된다.- 밝은 부분은 0에 가깝고 짙은 부분은 255에 가깝다.fig, a..
[Machine Learning] chapter5 - 트리 알고리즘 1. 결정트리로지스틱 회귀로 와인 분류하기import pandas as pdwine = pd.read_csv('https://bit.ly/wine_csv_data')wine.head() - 처음 3개의 열(alcohol, sugar, pH)은 알코올 도수, 당도, pH 값을 나타낸다.- 네 번째 열 (class)은 타깃값으로 0이면 레드 와인, 1이면 화이트 와인이다.- 화이트 와인이 양성 클래스이고 레드 와인과 화이트 와인을 구분하는 이진 분류 문제이다. wine.describe()- 위 그림에서 알 수 있는 것은 도수, 당도, pH 값의 스케일이 다르다는 것이다. data = wine[['alcohol','sugar','pH']].to_numpy()target = wine['class'].to_num..
[Machine Learning] chapter4 - 로지스틱 회귀 import pandas as pdfish = pd.read_csv('http://bit.ly/fish_csv_data')fish_input = fish[['Weight','Length','Diagonal','Width']].to_numpy()print(fish_input[:5])>>> [[242. 25.4 30. 4.02 ] [290. 26.3 31.2 4.3056] [340. 26.5 31.1 4.6961] [363. 29. 33.5 4.4555] [430. 29. 34. 5.134 ]]fish_target = fish['Species'].to_numpy()fr..
[Machine Learning] chapter3 - 회귀 알고리즘과 모델 규제 1. K-Nearest Neighbors Regression지도 학습 알고리즘은 크게 분류와 회귀(regression)으로 나뉜다.회귀는 클래스 중 하나로 분류하는 것이 아니라 임의의 숫자를 예측하는 문제로 정해진 클래스가 없고 수치를 출력한다. k-최근접 이웃 회귀도 분류와 똑같이 예측하려는 샘플에 가장 가까운 k개를 선택한다.하지만 회귀이기 때문에 샘플의 타깃은 클래스가 아니고 임의의 수치이다.이웃 샘플의 수치를 사용해 x를 예측하려면 이 수치들의 평균을 구하면 된다. 데이터 준비데이터를 준비하고 산점도를 그려보면,import numpy as npimport matplotlib.pyplot as pltperch_length = np.array([8.4, 13.7, 15.0, 16.2, 17.4, 18..
[Machine Learning] chapter 2 - 데이터 다루기 훈련 세트와 테스트 세트지도 학습과 비지도 학습머신러닝 알고리즘은 크게 지도 학습과 비지도 학습으로 나뉜다.지도 학습 알고리즘은 훈련하기 위한 데이터와 정답이 필요하다.지도 학습에서는 데이터와 정답을 input과 target 이라고 하고 이 둘을 합쳐 training data라고 부른다.앞 chapter에서 언급했듯이 입력으로 사용된 길이와 무게를 feature 라고 한다. 훈련 세트와 테스트 세트머신러닝 알고리즘의 성능을 제대로 평가하려면 훈련 데이터와 평가에 사용할 데이터가 각각 달라져야 한다.이렇게 하는 가장 간단한 방법은 평가를 위해 또 다른 데이터를 준비하거나 이미 준비된 데이터 중에서 일부를 떼어 내어 활용한다.평가에 사용하는 데이터를 test set, 훈련에 사용하는 데이터를 train se..
[Machine Learning] chapter 1 - 머신러닝 도미 데이터 준비하기bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0]bream_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0, 500.0, 475.0, 500.0, 500.0, 340.0, 600..