Pandas에서 설명() 함수를 사용하는 방법(예제 포함)


explain() 함수를 사용하여 Pandas DataFrame에 대한 설명 통계를 생성할 수 있습니다.

이 함수는 다음 기본 구문을 사용합니다.

 df. describe ()

다음 예는 다음 pandas DataFrame에서 실제로 이 구문을 사용하는 방법을 보여줍니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team points assists rebounds
0 to 25 5 11
1 to 12 7 8
2 B 15 7 10
3 B 14 9 6
4 B 19 12 6
5 C 23 9 5
6 C 25 9 9
7 C 29 4 12

예시 1: 모든 숫자 열 설명

기본적으로 explain() 함수는 pandas DataFrame의 숫자 열에 대한 설명 통계만 생성합니다.

 #generate descriptive statistics for all numeric columns
df. describe ()

	points assists rebounds
count 8.000000 8.00000 8.000000
mean 20.250000 7.75000 8.375000
std 6.158618 2.54951 2.559994
min 12.000000 4.00000 5.000000
25% 14.750000 6.50000 6.000000
50% 21.000000 8.00000 8.500000
75% 25,000000 9,00000 10,250000
max 29.000000 12.00000 12.000000

DataFrame의 세 숫자 열에 대한 설명 통계가 표시됩니다.

참고: 누락된 값이 있는 열이 있으면 Pandas는 기술 통계를 계산할 때 해당 값을 자동으로 제외합니다.

예시 2: 모든 열 설명

DataFrame의 각 열에 대한 기술 통계를 계산하려면 include=’all’ 인수를 사용할 수 있습니다.

 #generate descriptive statistics for all columns
df. describe (include=' all ')

	team points assists rebounds
count 8 8.000000 8.00000 8.000000
single 3 NaN NaN NaN
top B NaN NaN NaN
freq 3 NaN NaN NaN
mean NaN 20.250000 7.75000 8.375000
std NaN 6.158618 2.54951 2.559994
min NaN 12.000000 4.00000 5.000000
25% NaN 14.750000 6.50000 6.000000
50% NaN 21.000000 8.00000 8.500000
75% NaN 25.000000 9.00000 10.250000
max NaN 29.000000 12.00000 12.000000

예시 3: 특정 열 설명

다음 코드는 Pandas DataFrame의 특정 열에 대한 기술 통계를 계산하는 방법을 보여줍니다.

 #calculate descriptive statistics for 'points' column only
df[' points ']. describe ()

count 8.000000
mean 20.250000
std 6.158618
min 12.000000
25% 14.750000
50% 21,000000
75% 25,000000
max 29.000000
Name: points, dtype: float64

다음 코드는 여러 특정 열에 대한 기술 통계를 계산하는 방법을 보여줍니다.

 #calculate descriptive statistics for 'points' and 'assists' columns only
df[[' points ', ' assists ']]. describe ()

	assist points
count 8.000000 8.00000
mean 20.250000 7.75000
std 6.158618 2.54951
min 12.000000 4.00000
25% 14.750000 6.50000
50% 21,000000 8,00000
75% 25.000000 9.00000
max 29.000000 12.00000

여기서 explain() 함수에 대한 전체 문서를 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 기능을 수행하는 방법을 설명합니다.

Pandas: 열에서 고유한 값을 찾는 방법
Pandas: 두 줄의 차이점을 찾는 방법
Pandas: DataFrame에서 누락된 값을 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다