[pandas]

 

판다스란 파이썬 라이브러리다.

 

자료구조인 Series와 DataFrame을 이용한다. -> 빅데이터 분석에 도움이 된다.

 

1.

import pandas as pd

라이브러리를 불러온다.

 

 

2.

데이터프레임을 만드는데 3가지 방법이 있다.

 

1)딕셔너리를 바꾸는 방법

딕셔너리data가 있다했을때, d = pd.DataFrame(data)

 

2)리스트를 바꾸는 방법

리스트names와 리스트births가 있다했을때, data = list(zip(names,births)) df = pd.DataFrame(data)

DataFrame()함수에 2,3번째 매개변수를 넣지 않으면 위와같이 colums와 index가 0,1,2...으로 설정된다.

따라서, d = pd.DataFrame(data, columns = ['names','births'],index = ['one','two','three']) 로 바꿔주자.

 

 

3)numpy의 array를 바꾸는 방법

?

 

 

[numpy]

벡터 및 행렬 연산에 쓰인다.

 

넘파이 배열을 사용한다 (리스트와 다르다)

 

밑 그림과 같은 방식으로 모든 사칙연산이 가능하다 행렬계산에 매우 용이하다.

 

[Matplotlib]

시각화 라이브러리다.

 

한마디로 눈에 글이나 숫자가 아니라 그림으로써 보여지게 해주는 라이브러리다.

 

numpy와 pandas에서 사용하는 자료구조를 손쉽게 보여준다.

 

 

 

이렇게 위에서 pandas의 데이터프레임에 저장한 데이터들을 한눈에 보기쉽게 표현해준다.

 

%matplotlib inline이란

 

매직코맨드라고 부른다, 현재 실행중인 주피터 노트북에서 그래프를 출력 가능하도록 선언하는 명령어

'이제는 사용하지 않는 공부방 > 컴퓨터공학 필수정보' 카테고리의 다른 글

git/github 입문 완벽 정리  (0) 2021.01.03
Git 사용법  (2) 2020.02.29
iccv 학회  (0) 2020.02.18
증강현실과 가상현실  (0) 2020.02.18
컴퓨터비전과 영상처리  (0) 2020.02.18

+ Recent posts