Как рассчитать стандартное отклонение в pandas: с примерами
Вы можете использовать функцию DataFrame.std() для расчета стандартного отклонения значений в DataFrame pandas.
На практике вы можете использовать следующие методы для расчета стандартного отклонения:
Метод 1: вычислить стандартное отклонение столбца
df [ ' column_name ' ] . std ( )
Метод 2: вычислить стандартное отклонение нескольких столбцов
df [[ ' column_name1 ', ' column_name2 '] ] . std ( )
Метод 3: вычислить стандартное отклонение всех числовых столбцов.
df . std ( )
Обратите внимание, что функция std() автоматически игнорирует любые значения NaN в DataFrame при вычислении стандартного отклонения.
В следующих примерах показано, как использовать каждый метод со следующим DataFrame pandas:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) team points assists rebounds 0 to 25 5 11 1 to 12 7 8 2 B 15 7 10 3 B 14 9 6 4 B 19 12 6 5 B 23 9 5 6 C 25 9 9 7 C 29 4 12
Метод 1: вычислить стандартное отклонение столбца
Следующий код показывает, как вычислить стандартное отклонение столбца в DataFrame:
#calculate standard deviation of 'points' column df [ ' points ' ] . std ( ) 6.158617655657106
Стандартное отклонение оказывается равным 6,1586 .
Метод 2: вычислить стандартное отклонение нескольких столбцов
Следующий код показывает, как вычислить стандартное отклонение нескольких столбцов в DataFrame:
#calculate standard deviation of 'points' and 'rebounds' columns
df[[' points ', ' rebounds ']]. std ()
points 6.158618
rebounds 2.559994
dtype:float64
Стандартное отклонение столбца «очки» составляет 6,1586 , а стандартное отклонение столбца «отскоки» — 2,5599 .
Метод 3: вычислить стандартное отклонение всех числовых столбцов.
Следующий код показывает, как вычислить стандартное отклонение каждого числового столбца в DataFrame:
#calculate standard deviation of all numeric columns
df. std ()
points 6.158618
assists 2.549510
rebounds 2.559994
dtype:float64
Обратите внимание, что панды не вычисляли стандартное отклонение столбца «команда», поскольку это не был числовой столбец.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:
Как рассчитать среднее значение столбцов в Pandas
Как рассчитать медиану столбца в Pandas
Как рассчитать максимальное значение столбцов в Pandas