Pandas で中央値を計算する方法 (例付き)
median()関数を使用すると、pandas DataFrame 内の 1 つ以上の列の中央値を見つけることができます。
#find median value in specific column
df[' column1 ']. median ()
#find median value in several columns
df[[' column1 ', ' column2 ']]. median ()
#find median value in every numeric column
df. median ()
次の例は、実際に次の pandas DataFrame でこの関数を使用する方法を示しています。
#createDataFrame
df = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
' points ': [25, pd. NA , 15, 14, 19, 23, 25, 29],
' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#view DataFrame
df
player points assists rebounds
0 to 25 5 11
1 B NA 7 8
2 C 15 7 10
3 D 14 9 6
4 E 19 12 6
5 F 23 9 5
6 G 25 9 9
7:29 4 12
例 1: 単一列の中央値を求める
次のコードは、pandas DataFrame の単一列の中央値を見つける方法を示しています。
#find median value of points column
df[' points ']. median ()
23.0
ポイント列の中央値は23です。
デフォルトでは、 median()関数は中央値を計算するときにすべての欠損値を無視することに注意してください。
例 2: 複数の列の中央値を求める
次のコードは、pandas DataFrame 内の複数の列の中央値を見つける方法を示しています。
#find median value of points and rebounds columns
df[[' points ', ' rebounds ']]. median ()
points 23.0
rebounds 8.5
dtype:float64
例 3: すべての数値列の中央値を求める
次のコードは、pandas DataFrame 内のすべての数値列の中央値を見つける方法を示しています。
#find median value of all numeric columns
df. median ()
points 23.0
assists 8.0
rebounds 8.5
dtype:float64
追加リソース
Pandas で列の平均を計算する方法
Pandasで列の合計を計算する方法
Pandasで列の最大値を見つける方法