728x90
판다스(Pandas) 란
- Pyhton Data Analysis Library. 정형 데이터 분석에 최적화된 라이브러리
- 2008년에 만들어졌으며, 2009년에 100% 오픈소스가 되었다
- DataFrame 형태로 모든 데이터를 표현한다
- 다양한 데이터 조작 기능을 제공한다 ex. 인덱싱, 필터링 등
- 벡터 연산에 최적화되어 있다. ( Numpy와 비슷 )
판다스 라이브러리
import pandas as pd
판다스(Pandas)를 사용해야 하는 이유
- 대부분의 정제된 데이터들은 테이블 형태로 표현된다. 이러한 형태를 분석하기에 최적화된 라이브러리가 판다스이다
- 넘파이처럼 정형회된 데이터 연산에 대해 성능이 매우 뛰어나다
- 다양한 정형 데이터를 통합 관리할 수 있다( json, html, csv, xlsx 등 )
- 엑셀에서 제공하는 대부분의 연산 기능을 제공한다. 즉, 편의성이 좋다
Pandas DataFrame
- pandas 라이브러리가 사용하는 기본 자료구조.
- DataFrame은 2차원 테이블 구조다
- Series는 1차원 구조다( 1 row, 1 column )
- row, column으로 모든 원소를 구분한다 ( 인덱싱 )
- index, columns, values라는 객체 변수를 갖는다
- Relational DB와 완전히 호환이 가능하다
- 하나의 column을 기준으로 모든 원소의 data type이 동일하다
728x90
'파이썬' 카테고리의 다른 글
[파이썬] OOP 객체 지향 프로그래밍 (0) | 2022.04.18 |
---|---|
[파이썬] 넘파이(Numpy) 메서드 실습 (0) | 2022.04.15 |
[파이썬] 넘파이(Numpy) 란 (0) | 2022.04.15 |
[파이썬] 힙(Heap) 이란 (0) | 2022.04.15 |
[파이썬] 데이터 타입(Data Type) 종류 (0) | 2022.04.14 |