[pandas]
판다스란 파이썬 라이브러리다.
자료구조인 Series와 DataFrame을 이용한다. -> 빅데이터 분석에 도움이 된다.
1.
import pandas as pd
라이브러리를 불러온다.
2.
데이터프레임을 만드는데 3가지 방법이 있다.
1)딕셔너리를 바꾸는 방법
딕셔너리data가 있다했을때, d = pd.DataFrame(data)
2)리스트를 바꾸는 방법
리스트names와 리스트births가 있다했을때, data = list(zip(names,births)) df = pd.DataFrame(data)
DataFrame()함수에 2,3번째 매개변수를 넣지 않으면 위와같이 colums와 index가 0,1,2...으로 설정된다.
따라서, d = pd.DataFrame(data, columns = ['names','births'],index = ['one','two','three']) 로 바꿔주자.
3)numpy의 array를 바꾸는 방법
?
[numpy]
벡터 및 행렬 연산에 쓰인다.
넘파이 배열을 사용한다 (리스트와 다르다)
밑 그림과 같은 방식으로 모든 사칙연산이 가능하다 행렬계산에 매우 용이하다.
[Matplotlib]
시각화 라이브러리다.
한마디로 눈에 글이나 숫자가 아니라 그림으로써 보여지게 해주는 라이브러리다.
numpy와 pandas에서 사용하는 자료구조를 손쉽게 보여준다.
이렇게 위에서 pandas의 데이터프레임에 저장한 데이터들을 한눈에 보기쉽게 표현해준다.
%matplotlib inline이란
매직코맨드라고 부른다, 현재 실행중인 주피터 노트북에서 그래프를 출력 가능하도록 선언하는 명령어 |
'이제는 사용하지 않는 공부방 > 컴퓨터공학 필수정보' 카테고리의 다른 글
git/github 입문 완벽 정리 (0) | 2021.01.03 |
---|---|
Git 사용법 (2) | 2020.02.29 |
iccv 학회 (0) | 2020.02.18 |
증강현실과 가상현실 (0) | 2020.02.18 |
컴퓨터비전과 영상처리 (0) | 2020.02.18 |