pandas groupby 예제

Off
Non classé

출력 : 이제 우리는 잠재적 인 속도 향상을 달성하기 위해 정렬을 사용하여 groupby()를 적용 : 여러 키로 데이터를 그룹화 : 여러 키로 데이터를 그룹화하기 위해, 우리는 groupby 함수에서 여러 키를 전달합니다. Pandas agg 메서드의 매우 깔끔한 점은 사용자 지정 함수를 작성하고 전달할 수 있다는 것입니다. 최소 급여에 대한 열 하나와 최대 급여에 대한 열 하나를 갖는 대신 급여 범위가있는 열을 갖기를 원했다고 가정 해 봅시다: 우리가 살펴 볼 구문의 마지막 조각은 팬더의 « agg() » 함수입니다. agg() 함수에서 제공하는 집계 기능을 사용하면 한 계산에서 그룹당 여러 통계를 계산할 수 있습니다. 구문은 간단하며 MongoDB의 집계 프레임워크와 유사합니다. GroupBy와 관련이 없는 데이터프레임 사용 예제의 경우, 예를 들어 팬더 데이터프레임을 데이터프레임으로 쉽게 변환할 수 있습니다. 우리는 실제로 이미 그것을 했습니다. 그러나 이 예제에서는 세 그룹당 평균 값을 계산합니다. 또한 각 열에 접미사를 추가하고 reset_index를 사용하여 데이터 프레임을 가져옵니다. 변환: 일부 그룹별 계산을 수행하고 같은 인덱싱된 개체를 반환합니다. 몇 가지 예: 참고 :이에서 우리는 키로 그룹화 개체를 참조합니다.

하나의 키로 데이터 그룹화: 하나의 키로 데이터를 그룹화하기 위해 groupby 함수에서 하나의 키만 인수로 전달합니다. 이 노트북에서이 게시물의 모든 예제 보기: 팬더-groupby-post groupby() 변형이 많은 매우 강력한 기능입니다. 그것은 정말 쉽고 효율적으로 몇 가지 기준에 걸쳐 데이터 프레임을 분할하는 작업을합니다. 또한 groupby 메서드 get_group을 사용하여 그룹화된 데이터를 필터링할 수도 있습니다. 다음 코드 예제에서는 조교수 그룹(즉, « AsstProf »)을 선택합니다. 그룹화 및 집계 작업의 출력은 팬더 시리즈와 팬더 데이터 프레임 간에 따라 다르므로 새 사용자에게 혼동을 줄 수 있습니다. 일반적으로 두 개 이상의 결과 열을 계산하면 결과가 Dataframe이 됩니다. 결과의 단일 열에 대 한 agg 함수는 기본적으로 시리즈를 생성 합니다. 집계 함수는 반환된 개체의 차원을 줄이는 함수입니다(예: 평균, 합계, 크기, 개수, std, var, sem, 설명, 첫 번째, 마지막, 마지막, nth, min, max) 이것은 예를 들어 DataFrame.sum() 및 시리즈를 다시 얻을 때 발생 합니다. 이제 우리는 계속해서 각 계급과 규율의 남성과 여성의 비율을 계산할 수 있습니다.

이 및 다음, 팬더 groupby 예제우리는 람다 함수와 함께 apply 메서드를 사용 하려고 합니다. groupby() 함수는 GroupBy 개체를 반환하지만 기본적으로 원래 데이터 집합의 행이 분할된 방법을 설명합니다. GroupBy 개체 .group 변수는 키가 계산된 고유 그룹이며 해당 값이 각 그룹에 속하는 축 레이블인 사전입니다. 예를 들어:이 기능에 온라인 리소스의 많음이 있다, 그리고 난 정말 어떤 시점에서 본격적으로 팬더를 사용 하는 경우이 구문을 정복 recommomend 것 이다. groupby에 전달된 문자열은 열 또는 인덱스 수준을 참조할 수 있습니다. 문자열이 열 이름과 인덱스 수준 이름을 모두 일치하면 ValueError가 발생합니다. 우리는 팬더를 사용하여 자연스럽고 표현하기 쉬운 작업을 만드는 것을 목표로합니다. GroupBy 기능의 각 영역을 해결 한 다음 몇 가지 사소한 예제 / 사용 사례를 제공합니다.

Comments are closed.