Як обчислити стандартне відхилення в pandas: із прикладами


Ви можете використовувати функцію DataFrame.std() , щоб обчислити стандартне відхилення значень у pandas DataFrame.

Для розрахунку стандартного відхилення на практиці можна використовувати такі методи:

Спосіб 1. Обчисліть стандартне відхилення стовпця

 df [ ' column_name ' ] . std ( )

Спосіб 2. Обчисліть стандартне відхилення кількох стовпців

 df [[ ' column_name1 ', ' column_name2 '] ] . std ( )

Спосіб 3: обчисліть стандартне відхилення всіх числових стовпців

 df . std ( )

Зауважте, що функція std() автоматично ігноруватиме будь-які значення NaN у DataFrame під час обчислення стандартного відхилення.

У наведених нижче прикладах показано, як використовувати кожен метод із такими pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

	team points assists rebounds
0 to 25 5 11
1 to 12 7 8
2 B 15 7 10
3 B 14 9 6
4 B 19 12 6
5 B 23 9 5
6 C 25 9 9
7 C 29 4 12

Спосіб 1. Обчисліть стандартне відхилення стовпця

Наступний код показує, як обчислити стандартне відхилення стовпця в DataFrame:

 #calculate standard deviation of 'points' column
df [ ' points ' ] . std ( )

6.158617655657106

Стандартне відхилення виявляється рівним 6,1586 .

Спосіб 2. Обчисліть стандартне відхилення кількох стовпців

Наступний код показує, як обчислити стандартне відхилення кількох стовпців у DataFrame:

 #calculate standard deviation of 'points' and 'rebounds' columns
df[[' points ', ' rebounds ']]. std ()

points 6.158618
rebounds 2.559994
dtype:float64

Стандартне відхилення стовпця «очки» становить 6,1586 , а стандартне відхилення стовпця «підбирання» — 2,5599 .

Спосіб 3: обчисліть стандартне відхилення всіх числових стовпців

Наступний код показує, як обчислити стандартне відхилення кожного числового стовпця в DataFrame:

 #calculate standard deviation of all numeric columns
df. std ()

points 6.158618
assists 2.549510
rebounds 2.559994
dtype:float64

Зверніть увагу, що панди не обчислили стандартне відхилення стовпця «команда», оскільки це не був числовий стовпець.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові операції в pandas:

Як обчислити середнє значення стовпців у Pandas
Як обчислити медіану стовпця в Pandas
Як обчислити максимальне значення стовпців у Pandas

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *