-
Machine Learning 실습 (14)Machine Learning 2022. 7. 18. 14:55
1 목표
- 손글씨(0~9)를 분류하는 모델을 만들어보자
- 여러모델을 사용해보자
- 이미지 데이터 다루는 방법을 알아보자
# 도구 불러오기 import numpy as np import pandas as pd import matplotlib.pyplot as plt
2. 데이터 불러오기
digit_data = pd.read_csv('./digit_train.csv') digit_data # train -> 학습시킬때 # test -> 예측할때
### 크기 확인 .shape ### 결측치 확인 ### 데이터 타입 digit_data.info() # 행 42000, 열 785 # label to pixel783 # dtypes : int64(785)
digit_data.head()
3. EDA
- 데이터를 이미지화해서 출력해보기
# 2번째 인덱스 값의 이미지 확인해보기 # 인덱싱하기 img2 = digit_data.iloc[2,1:] # 이미지 데이터 img2_lb = digit_data.iloc[2,0] # 이미지 실제답
# pring(img2 최대, 최소 픽셀값 확인) print(img2.min()) print(img2.max()) # 픽셀의 범위값 : 0 ~ 255 # 0 : 검은색 ~ 255 : 흰색 # ex) 200 밝은계열 # ex) 50 어두운 계열
0
255
# 히스토그램으로 픽셀 범위값 시각화 plt.hist(img2, bins = 255) # y축 범위 좁혀서 보기 plt.ylim(0,200) plt.show()
# 이미지 출력 plt.imshow(img2.values.reshape(28,28), cmap ='gray') # matplotlib에서 이미지를 출력할때 사용하는 함수 plt.show()
img2_lb
1
'Machine Learning' 카테고리의 다른 글
Machine Learning 실습 (16) (0) 2022.07.18 Machine Learning 실습 (15) (0) 2022.07.18 Machine Learning 실습 (13) (0) 2022.07.15 Machine Learning 실습 (12) (0) 2022.07.14 Machine Learning 실습 (11) (0) 2022.07.14