-
Machine Learning 실습 (1)Machine Learning 2022. 7. 12. 09:55
pandas 와 matplotlib의 개념
import pandas as pd # 1,2 차원의 테이블 형식 데이터를 다루는 모듈 import matplotlib.pyplot as plt # 시각화 도와주는 모듈 # 한국어 처리 - 글꼴 설정 from matplotlib import rc rc('font', family = 'Malgun Gothic')
ai_class = pd.DataFrame([['2022-06-27','[원표] Zoom 회의 참가https://us02web.zoom.us/j/8318135592?pwd=L0RJaTA4NFlJZWtXTWJNc215bHM5Zz09'], ['2022-06-27','[운비] 줌 링크 감사합니다~! 오늘은 오전 서버시험 오후 스프링 수업입니다!!!! 제가 오늘 연차라 개발원에 없을거에요! 이슈나 특이사항은 규남쌤께 연락하시면 됩니당ㅎㅎ 오늘 하루도 화이팅 하시고, 저랑은 내일 만나요 우리반💗'], ['2022-06-27','[원표] 원표팀 완료'], ['2022-06-27','[벼리] 벼리팀 큐알 완료요'], ['2022-06-27','[혜미] 혜미팀 큐알 완료했습니다'], ['2022-06-27','[규남] 우담씨..?'], ['2022-06-27','[찬종] 버스에서 내렸대용'], ['2022-06-27','[설아] 선생님 톰캣 서버가 오류나요ㅜㅜ'], ['2022-06-27','[예지] 선생님 저도 톰캣좀 봐주세욥'], ['2022-06-27','[다연] 저두용'], ['2022-06-27','[예지] 쌤 저 또 안돼여.,'], ['2022-06-28','[운비] 좋은 아침입니다! 일찍 오신 분들 줌 링크 공유한번 부탁드리구요~ '], ['2022-06-28','[원표] 줌 로그아웃 되어있어요 ㅠㅠ'], ['2022-06-28','[혜미] 헤미팀 큐알 완했습니다'], columns = ['date','content']) ai_class
# 판다스 기본 옵션 설정 pd.set_option('display.max_colwidth',None) ai_class
1.1 info()로 ai_class의 정보를 확인
ai_class.info() # 데이터 크기 : 46행, 2열 (46, 2) # Non-Null Count : 결측치를 확인 # Dtype : 데이터 타입(형식) 문자열
1.2 str키워드 사용 : 판다스 객체 내의 문자열 데이터 자체에 접근하는 키워드
# str 예시 # 2023 년도로 변경해보기 # date 컬럼에 접근 (열인덱싱) ai_class['date'].replace('2022','2023') # 1차원 시리즈로 출력 # ai_class.loc[:, 'date'] # ai_class.iloc[:,0] ai_class['date'].str.replace('2022','2023')
사람별 카톡 빈도수 구하기 : 이름을 추출하여 새로운 컬럼으로 추가해보기
- name으로 추가
# 파이썬 기초 a = 'aaaaaaa1112' a[-1] # 판다스 -> 대상 str[:]
# 없는 컬럼이름 인덱싱하면서 대입 ai_class['name'] = ai_class['content'].str[1:3] ai_class.head()
'Machine Learning' 카테고리의 다른 글
Machine Learning 실습 (3) (0) 2022.07.12 Machine Learning 실습 (2) (0) 2022.07.12 머신러닝 이론 (4) (0) 2022.07.06 머신러닝 이론 (3) (0) 2022.07.06 머신러닝 이론 (2) (0) 2022.07.06