Pandas: explain()을 사용하고 과학적 표기법을 제거하는 방법


explain() 함수를 사용하여 Pandas DataFrame의 변수에 대한 설명 통계를 생성할 수 있습니다.

explain() 함수의 출력에서 과학적 표기법을 제거하려면 다음 방법을 사용할 수 있습니다.

방법 1: 열과 함께 explain()을 사용할 때 과학적 표기법을 제거합니다.

 df[' my_column ']. describe (). apply ( lambda x: format (x, ' f '))

방법 2: 여러 열에 explain()을 사용할 때 과학적 표기법을 제거합니다.

 df. describe (). apply ( lambda x: x.apply (' {0:.5f} '. format ))

다음 예에서는 다음 pandas DataFrame에서 실제로 각 메서드를 사용하는 방법을 보여줍니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' store ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' sales ': [8450550, 406530, 53000, 6000, 2000, 4000, 5400, 6500],
                   ' returns ':[2212200, 145200, 300, 2500, 700, 600, 800, 1200]})

#view DataFrame
print (df)

  store sales returns
0 A 8450550 2212200
1 A 406530 145200
2 A 53000 300
3 A 6000 2500
4 B 2000 700
5 B 4000 600
6 B 5400 800
7 B 6500 1200

예 1: 열과 함께 explain()을 사용할 때 과학 표기법 제거

explain() 함수를 사용하여 sales 열에 대한 기술 통계를 계산하면 출력 값이 과학적 표기법으로 표시됩니다.

 #calculate descriptive statistics for sales column
df[' sales ']. describe ()

count 8.000000e+00
mean 1.116748e+06
std 2.966552e+06
min 2.000000e+03
25% 5.050000e+03
50% 6.250000e+03
75% 1.413825e+05
max 8.450550e+06
Name: sales, dtype: float64

각 출력 값은 과학적 표기법을 사용하여 표시됩니다.

다음 구문을 사용하여 출력에서 과학적 표기법을 제거할 수 있습니다.

 #calculate descriptive statistics for sales column and suppress scientific notation
df[' sales ']. describe (). apply ( lambda x: format (x, ' f '))

count 8.000000
mean 1116747.500000
std 2966551.594104
min 2000.000000
25% 5050.000000
50% 6250.000000
75% 141382.500000
max 8450550.000000
Name: sales, dtype: object

이제 출력 값이 과학적 표기법 없이 표시됩니다.

예 2: 여러 열에 explain()을 사용할 때 과학 표기법 제거

explain() 함수를 사용하여 각 숫자 열에 대한 기술 통계를 계산하면 출력 값이 과학적 표기법으로 표시됩니다.

 #calculate descriptive statistics for each numeric column
df. describe ()

               sales returns
count 8.000000e+00 8.000000e+00
mean 1.116748e+06 2.954375e+05
std 2.966552e+06 7.761309e+05
min 2.000000e+03 3.000000e+02
25% 5.050000e+03 6.750000e+02
50% 6.250000e+03 1.000000e+03
75% 1.413825e+05 3.817500e+04
max 8.450550e+06 2.212200e+06

각 출력 값은 과학적 표기법을 사용하여 표시됩니다.

다음 구문을 사용하여 출력에서 과학적 표기법을 제거할 수 있습니다.

 #calculate descriptive statistics for numerical columns and suppress scientific notation
df. describe (). apply ( lambda x: x.apply (' {0:.5f} '. format ))

                sales returns
count 8.00000 8.00000
mean 1116747.50000 295437.50000
std 2966551.59410 776130.93692
min 2000.00000 300.00000
25% 5050.00000 675.00000
50% 6250.00000 1000.00000
75% 141382.50000 38175.00000
max 8450550.00000 2212200.00000

이제 출력 값이 과학적 표기법 없이 표시됩니다.

이 예에서는 출력에 소수점 이하 5 자리를 표시하기 위해 0:.5f를 사용했습니다.

다른 소수 자릿수를 표시하려면 5 를 다른 숫자로 바꿔보세요.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas: 그룹당 누적 합계를 계산하는 방법
Pandas: 그룹별로 고유한 값을 계산하는 방법
Pandas: 그룹별 상관관계를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다