-
Machine Learning 실습 (6)Machine Learning 2022. 7. 13. 12:21
# 데이터에 복잡한 처리를 하는 함수를 연결하는 기능(함수) : apply # 1. 사용자 정의 함수 : 복잡한 처리 # 2. 대상 데이터와 apply를 통해 연결 # 3. 처리가 완료된 데이터를 실제에 반영함(초기화) def fill_age(row): # row 행단위로 처리하게 만드는 함수 # 결측치가 있을 때 처리하는 조건문 if np.isnan(row['Age']): return gb1.loc[row['Pclass'],row['Sex'])] # 없으면 숫자값 그대로 반환하는 조건문 else: return row['Age']
train['Age'] = train.apply(fill_age, axis=1).astype('int64') train.info()
# fill_age 함수 이용해서 test 데이터 나이 결측치 처리 test['Age'] = test.apply(fill_age, axis=1).astype('int64') # info() test.info()
4-5. Cabin 결측치 처리(채우기)
# Cabin 에 어떤값이 들어있는지 확인 train['Cabin'].unique() # nan 결측치 # C85 (C층, 85번째방) # 임의로 'M' 값으로 결측치 채우기 train['Cabin'] = train['Cabin'].fillna('M') test['Cabin'] = test['Cabin'].fillna('M')
# 알파벳만 추출 train['Cabin'] = train['Cabin'].str[0] test['Cabin'] = test['Cabin'].str[0] test['Cabin']
train.info() test.info()
'Machine Learning' 카테고리의 다른 글
Machine Learning 실습 (8) (0) 2022.07.13 Machine Learning 실습 (7) (0) 2022.07.13 Machine Learning 실습 (5) (0) 2022.07.13 Machine Learning 실습 (4) (0) 2022.07.13 Machine Learning 실습 (3) (0) 2022.07.12