쓰는 자료구조 : series와 Data Frame
series:
values : 값 확인
index : 인덱스 확인(start - 시작점, stop - 마지막idx, step - 나아가는 단계)
obj = pd.Series([1, 2, 3, 5])
obj2 = pd.Series([1,2,3,5], index = ['d','b','a','c']) #인덱스 바꾸기 가능
#딕셔너리 자료형을 시리즈로
obj3 = pd.Series(dic)
#인덱스 변경
obj3.index = ['A','B','C','D']
데이터프레임:
data = {'A': [...], 'B' = [...],, ....}
df= pd.DataFrame(data)
#열방향: columns
#각 인덱스에 대한 이름 설정
df.index.name = 'Num'
df.columns.name = 'Info'
df2 = pd.DataFrame(data, columns=['year', 'name', 'points'], index = ['one', 'two', 'three', 'four'])
#추가법. 이 경우, index가 two, four, three인 애한테 밑의 series추가
val = pd.Series([-1, -2, -4], index = ['two', 'four', three'])
df['debt'] = val
#열삭제는 del df['debt']
#가져오기
df.loc['two' : 'four', 'points']
df.loc[:, ['year', 'names']]
#새 행 삽입
df.loc['six', :] = [2013, 'june', 1, 2, 3]
#새 값 대입. points가 3이상인 것의 penalty를 0으로
df.loc[df['points'] > 3.0, 'penalry' ] = 0
df = pd.DataFrame(np.random.randn(6,4)) #(6*4)짜리 랜덤 데이터프레임
df.fillna(value = 0.5)
#F열에서 NAN값 포함하는 행만 추출
df.loc[df.isnull()['F'], :]
#행방향, 열방향 합
df.sum(axis=0/1)
'버츄얼유튜버' 카테고리의 다른 글
호시노가 낮잠자면서도 이해하는 R-CNN (0) | 2022.02.04 |
---|---|
바보♡ 허접♡ 코하루도 이해하는 욜로(YOLO) (2) | 2022.01.29 |
비전 10 ) 모션 (2) | 2022.01.09 |
비전 9 ) 인식 (0) | 2022.01.08 |
비전 8) 기계학습 (0) | 2021.12.31 |