ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Machine Learning 실습 (6)
    Machine Learning 2022. 7. 13. 12:21
    # 데이터에 복잡한 처리를 하는 함수를 연결하는 기능(함수) : apply
    # 1. 사용자 정의 함수 : 복잡한 처리
    # 2. 대상 데이터와 apply를 통해 연결
    # 3. 처리가 완료된 데이터를 실제에 반영함(초기화)
    
    def fill_age(row):
        # row 행단위로 처리하게 만드는 함수
        # 결측치가 있을 때 처리하는 조건문
        if np.isnan(row['Age']):
            return gb1.loc[row['Pclass'],row['Sex'])]
        # 없으면 숫자값 그대로 반환하는 조건문
        else:
            return row['Age']
    train['Age'] = train.apply(fill_age, axis=1).astype('int64')
    train.info()

     

    # fill_age 함수 이용해서 test 데이터 나이 결측치 처리
    test['Age'] = test.apply(fill_age, axis=1).astype('int64')
    # info()
    test.info()

     

    4-5. Cabin 결측치 처리(채우기)

    # Cabin 에 어떤값이 들어있는지 확인
    train['Cabin'].unique()
    # nan 결측치
    # C85 (C층, 85번째방)
    # 임의로 'M' 값으로 결측치 채우기
    train['Cabin'] = train['Cabin'].fillna('M')
    test['Cabin'] = test['Cabin'].fillna('M')
    # 알파벳만 추출
    train['Cabin'] = train['Cabin'].str[0]
    test['Cabin'] = test['Cabin'].str[0]
    test['Cabin']

     

    train.info()
    test.info()

    'Machine Learning' 카테고리의 다른 글

    Machine Learning 실습 (8)  (0) 2022.07.13
    Machine Learning 실습 (7)  (0) 2022.07.13
    Machine Learning 실습 (5)  (0) 2022.07.13
    Machine Learning 실습 (4)  (0) 2022.07.13
    Machine Learning 실습 (3)  (0) 2022.07.12

    댓글

Designed by Tistory.