Pandas: 각 행의 표준 편차를 계산하는 방법

에 의해 벤자민 앤더슨 7월 13, 2023 가이드 댓글 0개

다음 기본 구문을 사용하여 Pandas DataFrame의 각 행에 대한 값의 표준 편차를 계산할 수 있습니다.

 df. std (axis= 1 , numeric_only= True )

axis=1 인수는 팬더에게 각 열 대신 각 행에 대해 계산을 수행하도록 지시하고, numeric_only=True 는 계산을 수행할 때 숫자 열만 고려하도록 팬더에게 지시합니다.

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예: Pandas의 각 행에 대한 표준 편차 계산

네 가지 게임 동안 다양한 농구 선수가 득점한 점수에 대한 정보가 포함된 다음과 같은 pandas DataFrame이 있다고 가정합니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' game1 ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' game2 ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' game3 ': [11, 8, 10, 6, 6, 5, 9, 12],
                   ' game4 ': [9, 8, 8, 9, 14, 15, 10, 11]})
                   
#view DataFrame
print (df)

  player game1 game2 game3 game4
0 A 18 5 11 9
1 B 22 7 8 8
2 C 19 7 10 8
3 D 14 9 6 9
4 E 14 12 6 14
5 F 11 9 5 15
6 G 20 9 9 10
7:28 4 12 11

다음 구문을 사용하여 각 플레이어가 득점한 점수의 표준 편차를 계산할 수 있습니다.

 #calculate standard deviation for each row
df. std (axis= 1 , numeric_only= True )

0 5.439056
1 7.182154
2 5.477226
3 3.316625
4 3.785939
5 4.163332
6 5.354126
7 10.144785
dtype:float64

결과를 해석하는 방법은 다음과 같습니다.

A 선수가 득점한 점수의 표준편차는 5.439 입니다.
B 선수가 득점한 점수의 표준편차는 7.182 입니다.
C 선수가 득점한 점수의 표준편차는 5.477 입니다.

등등.

std() 함수는 기본적으로 표본 표준 편차를 계산합니다.

대신 모집단 표준 편차를 계산하려면 ddof=0 인수를 사용해야 합니다.

 #calculate population standard deviation for each row
df. std (axis= 1 , ddof= 0 , numeric_only= True )

0 4.747351
1 5.881366
2 4.807037
3 3.384910
4 3.983518
5 3.915150
6 4.892772
7 8.091179
dtype:float64

관련 항목: 인구 대 샘플 표준 편차: 각각을 사용하는 경우

새 열에 표준 편차 값을 할당하려면 다음 구문을 사용할 수 있습니다.

 #add new column to display standard deviation for each row
df[' std_points '] = df. std (axis= 1 , numeric_only= True )

#view updated DataFrame
print (df)

  player game1 game2 game3 game4 points_std
0 A 18 5 11 9 5.439056
1 B 22 7 8 8 7.182154
2 C 19 7 10 8 5.477226
3 D 14 9 6 9 3.316625
4 E 14 12 6 14 3.785939
5 F 11 9 5 15 4.163332
6 G 20 9 9 10 5.354126
7:28 AM 4 12 11 10.144785

game1 , game2 , game3 및 game4 열의 각 행 값의 표준 편차가 이제 points_std 열에 표시됩니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas DataFrame의 첫 번째 행을 얻는 방법
Pandas DataFrame에서 첫 번째 행을 제거하는 방법
Pandas DataFrame에 행을 삽입하는 방법

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기

예: Pandas의 각 행에 대한 표준 편차 계산

추가 리소스

저자 소개

벤자민 앤더슨

의견을 추가하다