본문 바로가기
스터디 공간

[Pandas] groupby - Aggregation

by 재스민맛 2020. 12. 21.
반응형

1. groupby

 - 데이터 세트의 어떤 컬럼 혹은, 인덱스를 기준으로 데이터를 정렬할 때 groupby를 통해 쉽게 구현 가능

분할, 적용, 결합으로 이루어지며 한번 살펴보자

 

- 분할, 적용, 결합

- col1, col2를 가지는 DataFrame에서, col1을 기준으로 정렬하고 싶을 때, groupby를 사용한다.

col1을 기준으로 df.group('col1') 표현할 수 있으며,

col2로 정렬을 하려고 할땐, 마찬가지로, df.group('col2')로 표현이 가능.

groupby('col1') / groupby('col2)

- 동시에 2개를 묶기위해서는 어떻게 해야하는가??

-> df.group(['col1', 'col2'])

 

 

- Aggregation, transform, filter

  groupby에는 그룹데이터를 결합하기 전에 여러 유용한 연산을 효율적으로 구현하는 agg, transform, filter 메서드를 제공한다. 이를 통해 sum, mean, max, min.. 등의 다른 연산을 적용해보자

 

 1) agg 메서드는 df.groupby('col1').agg(~~~~) 등으로 표현할 수 있다.

    np를 통해서 나타낼 수 있음을 기억하자

    

    다른 데이터로 agg를 확인해보자

 

반응형

댓글