Pandas で標準偏差を計算する方法: 例付き


DataFrame.std()関数を使用して、pandas DataFrame の値の標準偏差を計算できます。

実際に標準偏差を計算するには、次の方法を使用できます。

方法 1: 列の標準偏差を計算する

 df [ ' column_name ' ] . std ( )

方法 2: 複数の列の標準偏差を計算する

 df [[ ' column_name1 ', ' column_name2 '] ] . std ( )

方法 3: すべての数値列の標準偏差を計算する

 df . std ( )

std()関数は、標準偏差を計算するときに DataFrame 内の NaN 値を自動的に無視することに注意してください。

次の例は、次の pandas DataFrame で各メソッドを使用する方法を示しています。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

	team points assists rebounds
0 to 25 5 11
1 to 12 7 8
2 B 15 7 10
3 B 14 9 6
4 B 19 12 6
5 B 23 9 5
6 C 25 9 9
7 C 29 4 12

方法 1: 列の標準偏差を計算する

次のコードは、DataFrame 内の列の標準偏差を計算する方法を示しています。

 #calculate standard deviation of 'points' column
df [ ' points ' ] . std ( )

6.158617655657106

標準偏差は6.1586であることがわかります。

方法 2: 複数の列の標準偏差を計算する

次のコードは、DataFrame 内の複数の列の標準偏差を計算する方法を示しています。

 #calculate standard deviation of 'points' and 'rebounds' columns
df[[' points ', ' rebounds ']]. std ()

points 6.158618
rebounds 2.559994
dtype:float64

「ポイント」列の標準偏差は6.1586 、「リバウンド」列の標準偏差は2.5599です。

方法 3: すべての数値列の標準偏差を計算する

次のコードは、DataFrame の各数値列の標準偏差を計算する方法を示しています。

 #calculate standard deviation of all numeric columns
df. std ()

points 6.158618
assists 2.549510
rebounds 2.559994
dtype:float64

「チーム」列は数値列ではないため、パンダはその標準偏差を計算しなかったことに注意してください。

追加リソース

次のチュートリアルでは、パンダで他の一般的な操作を実行する方法を説明します。

Pandas で列の平均を計算する方法
Pandas で列の中央値を計算する方法
Pandasの列の最大値を計算する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です