ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Machine Learning 실습 (15)
    Machine Learning 2022. 7. 18. 16:37

    이미지 한장 선택해서 출력해보기

    # 이미지 출력
    img = digit_data.iloc[40000,1:] # 이미지 데이터
    img_lb = digit_data.iloc[40000,0] # 이미지 실제답
    plt.imshow(img.values.reshape(28,28), cmap ='gray')
    # matplotlib에서 이미지를 출력할때 사용하는 함수
    plt.show()
    print('실제답:', img_lb)

     

    # 여러 장의 이미지 확인
    for i in range(100,131):
        # 이미지 출력
        img = digit_data.iloc[i,1:] # 이미지 데이터
        img_lb = digit_data.iloc[i,0] # 이미지 실제답
        plt.imshow(img.values.reshape(28,28), cmap ='gray')
        plt.show()
        print('실제답:', img_lb)

     

    4. 5000장 추출 활용

    digit_data

     

    X = digit_data.iloc[0:5000,1:]
    # 대문자 X == 문제, 특성, 피처, feature, 독립변수, label 컬럼 제외 모든 컬럼
    y = digit_data.iloc[0:5000,0]
    # 소문자 y == 답, label, 타겟, target, 종속변수, label 컬럼만
    print(X.shape)
    print(y.shape)

    (5000, 784)

    (5000,)

     

    train, test를 일정한 비율로 나누기

    - 7:3

    - sklearn 제공 train_test_split()

    from sklearn.model_selection import train_test_split
    X_train, X_test, y_train, y_test = train_test_split(X, y, 
                       test_size = 0.3, # 30% test용으로 분리 
                       random_state = 7)
    X_train.head()

     

    # 크기확인
    print('훈련용문제:', X_train.shape)
    print('훈련용답:', y_train.shape)
    print('테스트용문제:', X_test.shape)
    print('테스트용답:', y_test.shape)

    'Machine Learning' 카테고리의 다른 글

    Machine Learning 실습 (17)  (0) 2022.07.18
    Machine Learning 실습 (16)  (0) 2022.07.18
    Machine Learning 실습 (14)  (0) 2022.07.18
    Machine Learning 실습 (13)  (0) 2022.07.15
    Machine Learning 실습 (12)  (0) 2022.07.14

    댓글

Designed by Tistory.