python 기초/[Library] 3

Pandas [DataFrame]

[DataFrame] DataFrame : 엑셀과 같이, 인덱스(Index), 변수(Column), 값(Value)로 이루어진 데이터 구조 Pandas DataFrame의 장점 대용량 데이터를 빠르고 쉽게 다를 수 있다. 한계용량 : 엑셀 약 100MB / Pandas 1GB ~ 100GB 복잡한 기능을 구현하기 쉽고, 데이터 전처리를 쉽게 할 수 있다. 다른 시스템과 연동이 쉽다. Flask 라이브러리 : 웹 개발 / SQLAlchemy : 데이터베이스 / Sklearn : 머신러닝 리스트를 이용한 DataFrame 생성 import pandas as pd df = [ [1,2,3], [4,5,6], [7,8,9] ] df #[[1, 2, 3], [4, 5, 6], [7, 8, 9]] pd.DataFr..

Pandas [Series]

[Pandas : Numpy 기반으로 작성된 라이브러리] Series 형태와 DataFrame 형태 존재 [Series] Series의 기본적인 구조 import numpy as np import pandas as pd s1 = pd.Series([1,2,56,77,90]) s1 #0 1 #1 2 #2 56 #3 77 #4 90 #dtype: int64 s1.sum() #226 s1.mean() #45.2 리스트와 튜플 형태로 Series를 생성 s2 = pd.Series(['홍길동','이말년','최영철','주우재'], name='출석부', index= ['하나','둘','셋','넷']) s2 #하나 홍길동 #둘 이말년 #셋 최영철 #넷 주우재 #Name: 출석부, dtype: object Series는..

Numpy

[Numpy : 배열이나 행렬계산에 필요한 함수 제공] ndarray : Numpy의 데이터 타입중 하나로, 리스트와 비슷한 형식의 구조적인 데이터 이중 구조의 배열이나 행렬(Matrix)처럼 사용이 가능하며, 수학 과학연산을 모두 지원 Numpy 라이브러리 호출 import numpy as np data = [6,5,7,3,4,2] arr= np.array(data) arr.mean() #4.5 리스트와 배열의 데이터 타입 print(type(data)) print(type(arr)) #print(type(data)) #print(type(arr)) Numpy array 내부 데이터 타입 arr1 = np.array([1,2,3,4,5]) arr1.dtype #dtype('int32') arr2 = n..