본문 바로가기

버츄얼유튜버

Pandas

쓰는 자료구조 : series와 Data Frame

 

series: 

values : 값 확인
index : 인덱스 확인(start - 시작점, stop - 마지막idx, step - 나아가는 단계)

obj = pd.Series([1, 2, 3, 5])
obj2 = pd.Series([1,2,3,5], index = ['d','b','a','c']) #인덱스 바꾸기 가능

#딕셔너리 자료형을 시리즈로
obj3 = pd.Series(dic)

#인덱스 변경
obj3.index = ['A','B','C','D']

데이터프레임:

data = {'A': [...], 'B' = [...],, ....}

df= pd.DataFrame(data)

#열방향: columns
#각 인덱스에 대한 이름 설정
df.index.name = 'Num'
df.columns.name = 'Info'

df2 = pd.DataFrame(data, columns=['year', 'name', 'points'], index = ['one', 'two', 'three', 'four'])

#추가법. 이 경우, index가 two, four, three인 애한테 밑의 series추가
val = pd.Series([-1, -2, -4], index = ['two', 'four', three'])
df['debt'] = val

#열삭제는 del df['debt']
#가져오기
df.loc['two' : 'four', 'points']
df.loc[:, ['year', 'names']]

#새 행 삽입
df.loc['six', :] = [2013, 'june', 1, 2, 3]

#새 값 대입. points가 3이상인 것의 penalty를 0으로
df.loc[df['points'] > 3.0, 'penalry' ] = 0

df = pd.DataFrame(np.random.randn(6,4)) #(6*4)짜리 랜덤 데이터프레임
df.fillna(value = 0.5)

#F열에서 NAN값 포함하는 행만 추출
df.loc[df.isnull()['F'], :]

#행방향, 열방향 합
df.sum(axis=0/1)

 

https://doorbw.tistory.com/172

'버츄얼유튜버' 카테고리의 다른 글

호시노가 낮잠자면서도 이해하는 R-CNN  (0) 2022.02.04
바보♡ 허접♡ 코하루도 이해하는 욜로(YOLO)  (2) 2022.01.29
비전 10 ) 모션  (2) 2022.01.09
비전 9 ) 인식  (0) 2022.01.08
비전 8) 기계학습  (0) 2021.12.31