분류 전체보기
-
Machine Learning 실습 (13)Machine Learning 2022. 7. 15. 09:07
4.8 모델 선택 및 학습 from sklearn.tree import DecisionTreeClassifier # 분류 예측기 from sklearn.model_selection import cross_val_score # 교차검증 도구 # 교차 검증 - tree 모델의 성능은 어느정도 될지 확인 방법 # 일반화 성능 측정 tree_model = DecisionTreeClassifier() # max_depth 모델의 깊이 설정 # 모델의 깊이가 깊어지면 규칙이 많아짐 -> 모델이 복잡해짐 # train 에 대한 성능은 좋을 수 있지만, test에 대한 성능 떨어질 확률이 높음 # => 과대적합 # train 에 대한 성능도 떨어지고, test 에 대한 성능도 현저히 떨어질 확률이 높음 # => 과소적..
-
Machine Learning 실습 (12)Machine Learning 2022. 7. 14. 17:50
for cat_name in cat_feature : dummy = pd.get_dummies(test[cat_name], prefix = cat_name) # 기존 X_train에 병합 X_test = pd.concat([X_test,dummy], axis = 1) # 기존의 컬럼은 삭제 X_test.drop(cat_name, axis = 1, inplace = True) X_test.info() # set 집합 set(X_train.columns) - set(X_test.columns) X_test['Cabin_T'] = 0 X_test.info() X_train.info() # X_test 순서 정렬 X_test = X_test[X_train.columns]
-
Machine Learning 실습 (11)Machine Learning 2022. 7. 14. 17:48
4.6.8 불필요한 컬럼 삭제 train.columns # 'Name', 'Ticket' 삭제 # del # drop, inplace = True 실제 데이터 변수에 반영(초기화) train.drop(['Name','Ticket'],axis=1, inplace = True) train.info() test.drop(['Name','Ticket'],axis=1, inplace = True) test.info() 4.7 문제, 답으로 분리 train.head() . X_train = train.drop('Survived', axis = 1) # 훈련용 문제 -> fit 데이터에 맞춰서 학습할때 사용 y_train = train['Survived'] # 훈련용 답 -> fit 데이터에 맞춰서 학습할때 사용 X..
-
Machine Learning 실습 (10)Machine Learning 2022. 7. 14. 17:43
3.6.7 Text 데이터 다뤄보기 - Name 컬럼 사용해보기 : 중간 호칭 추출 # 1. 사용자 정의 함수 : 문자열 호칭 추출하는 기능을 만들어보자 def split_title(s) : return s.split(',')[1].split('.')[0].strip() train['Title'] = train['Name'].apply(split_title) test['Title'] = test['Name'].apply(split_title) plt.figure(figsize=(15,5)) # x,y sns.countplot(data=train,x='Title',hue='Survived') train['Title'].unique().size 17 # 호칭의 개수 정리해보기 title = ['Mr','Mr..
-
Machine Learning 실습 (9)Machine Learning 2022. 7. 14. 17:39
4.6.6 특성공학 : 새로운 컬럼을 추가해보자 - Parch, Sibsp 를 더하면 가족의 수가 됨 -> 가족의 수라는 새 컬럼을 추가 - train에 추가하면 test도 동일하게 추가해야 함 # train train['Family_Size'] = train['Parch'] + train['SibSp'] + 1 # test test['Family_Size'] = test['Parch'] + test['SibSp'] + 1 train.info() test.info() # 가족의 수와 생존/사망 여부 관계 확인 sns.countplot(data = train, x = 'Family_Size', hue = 'Survived') # 1일때는 사망율이 높고, 2~4명일때는 생존율이 높고, 5~ 사망율이 높아짐 ..
-
[라즈베리파이] 인체감지센서(HC-SR501) Display ON/OFF프로젝트 2022. 7. 14. 17:20
1. 구성도 2. 코드 import RPi.GPIO as GPIO import time class display1: def on(): f = open("/sys/class/backlight/10-0045/bl_power",'r') file = f.read() f.close() list = file.splitlines() print(list) for line in list: print(line) if line == '1': g = open("/sys/class/backlight/10-0045/bl_power", 'r') new = g.write("0") g.close() def off(): f = open("/sys/class/backlight/10-0045/bl_power", 'r') file = f.r..
-
-