Pandas: 각 행의 표준 편차를 계산하는 방법
다음 기본 구문을 사용하여 Pandas DataFrame의 각 행에 대한 값의 표준 편차를 계산할 수 있습니다.
df. std (axis= 1 , numeric_only= True )
axis=1 인수는 팬더에게 각 열 대신 각 행에 대해 계산을 수행하도록 지시하고, numeric_only=True 는 계산을 수행할 때 숫자 열만 고려하도록 팬더에게 지시합니다.
다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.
예: Pandas의 각 행에 대한 표준 편차 계산
네 가지 게임 동안 다양한 농구 선수가 득점한 점수에 대한 정보가 포함된 다음과 같은 pandas DataFrame이 있다고 가정합니다.
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
' game1 ': [18, 22, 19, 14, 14, 11, 20, 28],
' game2 ': [5, 7, 7, 9, 12, 9, 9, 4],
' game3 ': [11, 8, 10, 6, 6, 5, 9, 12],
' game4 ': [9, 8, 8, 9, 14, 15, 10, 11]})
#view DataFrame
print (df)
player game1 game2 game3 game4
0 A 18 5 11 9
1 B 22 7 8 8
2 C 19 7 10 8
3 D 14 9 6 9
4 E 14 12 6 14
5 F 11 9 5 15
6 G 20 9 9 10
7:28 4 12 11
다음 구문을 사용하여 각 플레이어가 득점한 점수의 표준 편차를 계산할 수 있습니다.
#calculate standard deviation for each row
df. std (axis= 1 , numeric_only= True )
0 5.439056
1 7.182154
2 5.477226
3 3.316625
4 3.785939
5 4.163332
6 5.354126
7 10.144785
dtype:float64
결과를 해석하는 방법은 다음과 같습니다.
- A 선수가 득점한 점수의 표준편차는 5.439 입니다.
- B 선수가 득점한 점수의 표준편차는 7.182 입니다.
- C 선수가 득점한 점수의 표준편차는 5.477 입니다.
등등.
std() 함수는 기본적으로 표본 표준 편차를 계산합니다.
대신 모집단 표준 편차를 계산하려면 ddof=0 인수를 사용해야 합니다.
#calculate population standard deviation for each row
df. std (axis= 1 , ddof= 0 , numeric_only= True )
0 4.747351
1 5.881366
2 4.807037
3 3.384910
4 3.983518
5 3.915150
6 4.892772
7 8.091179
dtype:float64
관련 항목: 인구 대 샘플 표준 편차: 각각을 사용하는 경우
새 열에 표준 편차 값을 할당하려면 다음 구문을 사용할 수 있습니다.
#add new column to display standard deviation for each row
df[' std_points '] = df. std (axis= 1 , numeric_only= True )
#view updated DataFrame
print (df)
player game1 game2 game3 game4 points_std
0 A 18 5 11 9 5.439056
1 B 22 7 8 8 7.182154
2 C 19 7 10 8 5.477226
3 D 14 9 6 9 3.316625
4 E 14 12 6 14 3.785939
5 F 11 9 5 15 4.163332
6 G 20 9 9 10 5.354126
7:28 AM 4 12 11 10.144785
game1 , game2 , game3 및 game4 열의 각 행 값의 표준 편차가 이제 points_std 열에 표시됩니다.
추가 리소스
다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
Pandas DataFrame의 첫 번째 행을 얻는 방법
Pandas DataFrame에서 첫 번째 행을 제거하는 방법
Pandas DataFrame에 행을 삽입하는 방법