728x90
[Pandas : Numpy 기반으로 작성된 라이브러리]
- Series 형태와 DataFrame 형태 존재
[Series]
- Series의 기본적인 구조
import numpy as np
import pandas as pd
s1 = pd.Series([1,2,56,77,90])
s1
#0 1
#1 2
#2 56
#3 77
#4 90
#dtype: int64
s1.sum()
#226
s1.mean()
#45.2
- 리스트와 튜플 형태로 Series를 생성
s2 = pd.Series(['홍길동','이말년','최영철','주우재'], name='출석부',
index= ['하나','둘','셋','넷'])
s2
#하나 홍길동
#둘 이말년
#셋 최영철
#넷 주우재
#Name: 출석부, dtype: object
- Series는 값(Value)과 순서(index)로 구성되어 있다.
- Series는 여러 가지 Python 데이터 타입으로 생성이 가능하다.
- Series 자체에 name 기능을 이용해, 이름을 부여할 수 있다.
- Series의 Indexing
myObject = {"name":"최영철", "age":28, 'gender':'male', 'job':'engineer'}
person = pd.Series(myObject, name='Person')
person
#name 최영철
#age 28
#gender male
#job engineer
#Name: Person, dtype: object
person[0]
#'최영철'
person['job']
#'engineer'
person[:]
#name 최영철
#age 28
#gender male
#job engineer
#Name: Person, dtype: object
- 비교 연산자를 이용한 indexing
person == 'male'
#name False
#age False
#gender True
#job False
#Name: Person, dtype: bool
person[person == 'male']
#gender male
#Name: Person, dtype: object
728x90
'python 기초 > [Library]' 카테고리의 다른 글
Pandas [DataFrame] (0) | 2023.06.27 |
---|---|
Numpy (0) | 2023.06.27 |