ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Machine Learning 실습 (14)
    Machine Learning 2022. 7. 18. 14:55

    1  목표

    - 손글씨(0~9)를 분류하는 모델을 만들어보자

    - 여러모델을 사용해보자

    - 이미지 데이터 다루는 방법을 알아보자

    # 도구 불러오기
    import numpy as np
    import pandas as pd
    import matplotlib.pyplot as plt

     

    2. 데이터 불러오기

    digit_data = pd.read_csv('./digit_train.csv')
    digit_data
    
    # train -> 학습시킬때
    # test -> 예측할때

     

    ### 크기 확인 .shape
    ### 결측치 확인
    ### 데이터 타입
    digit_data.info()
    
    # 행 42000, 열 785
    # label to pixel783
    # dtypes : int64(785)

     

    digit_data.head()

     

    3. EDA

    - 데이터를 이미지화해서 출력해보기

    # 2번째 인덱스 값의 이미지 확인해보기
    # 인덱싱하기
    img2 = digit_data.iloc[2,1:] # 이미지 데이터
    img2_lb = digit_data.iloc[2,0] # 이미지 실제답
    # pring(img2 최대, 최소 픽셀값 확인)
    print(img2.min())
    print(img2.max())
    # 픽셀의 범위값 : 0 ~ 255
    # 0 : 검은색 ~ 255 : 흰색
    # ex) 200 밝은계열
    # ex) 50 어두운 계열

    0

    255

     

    # 히스토그램으로 픽셀 범위값 시각화
    plt.hist(img2, bins = 255)
    # y축 범위 좁혀서 보기
    plt.ylim(0,200)
    plt.show()

     

    # 이미지 출력
    plt.imshow(img2.values.reshape(28,28), cmap ='gray')
    # matplotlib에서 이미지를 출력할때 사용하는 함수
    plt.show()

     

    img2_lb

    1

    'Machine Learning' 카테고리의 다른 글

    Machine Learning 실습 (16)  (0) 2022.07.18
    Machine Learning 실습 (15)  (0) 2022.07.18
    Machine Learning 실습 (13)  (0) 2022.07.15
    Machine Learning 실습 (12)  (0) 2022.07.14
    Machine Learning 실습 (11)  (0) 2022.07.14

    댓글

Designed by Tistory.