-
Machine Learning 실습 (15)Machine Learning 2022. 7. 18. 16:37
이미지 한장 선택해서 출력해보기
# 이미지 출력 img = digit_data.iloc[40000,1:] # 이미지 데이터 img_lb = digit_data.iloc[40000,0] # 이미지 실제답 plt.imshow(img.values.reshape(28,28), cmap ='gray') # matplotlib에서 이미지를 출력할때 사용하는 함수 plt.show() print('실제답:', img_lb)
# 여러 장의 이미지 확인 for i in range(100,131): # 이미지 출력 img = digit_data.iloc[i,1:] # 이미지 데이터 img_lb = digit_data.iloc[i,0] # 이미지 실제답 plt.imshow(img.values.reshape(28,28), cmap ='gray') plt.show() print('실제답:', img_lb)
4. 5000장 추출 활용
digit_data
X = digit_data.iloc[0:5000,1:] # 대문자 X == 문제, 특성, 피처, feature, 독립변수, label 컬럼 제외 모든 컬럼 y = digit_data.iloc[0:5000,0] # 소문자 y == 답, label, 타겟, target, 종속변수, label 컬럼만
print(X.shape) print(y.shape)
(5000, 784)
(5000,)
train, test를 일정한 비율로 나누기
- 7:3
- sklearn 제공 train_test_split()
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.3, # 30% test용으로 분리 random_state = 7) X_train.head()
# 크기확인 print('훈련용문제:', X_train.shape) print('훈련용답:', y_train.shape) print('테스트용문제:', X_test.shape) print('테스트용답:', y_test.shape)
'Machine Learning' 카테고리의 다른 글
Machine Learning 실습 (17) (0) 2022.07.18 Machine Learning 실습 (16) (0) 2022.07.18 Machine Learning 실습 (14) (0) 2022.07.18 Machine Learning 실습 (13) (0) 2022.07.15 Machine Learning 실습 (12) (0) 2022.07.14