반응형
1. groupby
- 데이터 세트의 어떤 컬럼 혹은, 인덱스를 기준으로 데이터를 정렬할 때 groupby를 통해 쉽게 구현 가능
분할, 적용, 결합으로 이루어지며 한번 살펴보자
- 분할, 적용, 결합
- col1, col2를 가지는 DataFrame에서, col1을 기준으로 정렬하고 싶을 때, groupby를 사용한다.
col1을 기준으로 df.group('col1') 표현할 수 있으며,
col2로 정렬을 하려고 할땐, 마찬가지로, df.group('col2')로 표현이 가능.
- 동시에 2개를 묶기위해서는 어떻게 해야하는가??
-> df.group(['col1', 'col2'])
- Aggregation, transform, filter
groupby에는 그룹데이터를 결합하기 전에 여러 유용한 연산을 효율적으로 구현하는 agg, transform, filter 메서드를 제공한다. 이를 통해 sum, mean, max, min.. 등의 다른 연산을 적용해보자
1) agg 메서드는 df.groupby('col1').agg(~~~~) 등으로 표현할 수 있다.
np를 통해서 나타낼 수 있음을 기억하자
다른 데이터로 agg를 확인해보자
반응형
'스터디 공간' 카테고리의 다른 글
[회로이론] Spectre (2) - Syntax (0) | 2021.03.01 |
---|---|
[Pandas] 누락 데이터 처리 (0) | 2021.03.01 |
[Study w/ VS Code] Tensorflow - Day1 (0) | 2021.03.01 |
[회로이론] Spectre (1) - 개론 (0) | 2021.03.01 |
[회로이론/전자회로/수동부품] 캐패시터 / Capacitor / Decap (0) | 2021.01.18 |
댓글