Jak obliczyć odchylenie standardowe w pandach: z przykładami
Możesz użyć funkcji DataFrame.std() do obliczenia odchylenia standardowego wartości w pandzie DataFrame.
W praktyce do obliczenia odchylenia standardowego można zastosować następujące metody:
Metoda 1: Oblicz odchylenie standardowe kolumny
df [ ' column_name ' ] . std ( )
Metoda 2: Oblicz odchylenie standardowe wielu kolumn
df [[ ' column_name1 ', ' column_name2 '] ] . std ( )
Metoda 3: Oblicz odchylenie standardowe wszystkich kolumn liczbowych
df . std ( )
Należy pamiętać, że funkcja std() automatycznie zignoruje wszelkie wartości NaN w DataFrame podczas obliczania odchylenia standardowego.
Poniższe przykłady pokazują, jak używać każdej metody z następującą ramką DataFrame pand:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) team points assists rebounds 0 to 25 5 11 1 to 12 7 8 2 B 15 7 10 3 B 14 9 6 4 B 19 12 6 5 B 23 9 5 6 C 25 9 9 7 C 29 4 12
Metoda 1: Oblicz odchylenie standardowe kolumny
Poniższy kod pokazuje, jak obliczyć odchylenie standardowe kolumny w ramce DataFrame:
#calculate standard deviation of 'points' column df [ ' points ' ] . std ( ) 6.158617655657106
Odchylenie standardowe wynosi 6,1586 .
Metoda 2: Oblicz odchylenie standardowe wielu kolumn
Poniższy kod pokazuje, jak obliczyć odchylenie standardowe wielu kolumn w ramce DataFrame:
#calculate standard deviation of 'points' and 'rebounds' columns
df[[' points ', ' rebounds ']]. std ()
points 6.158618
rebounds 2.559994
dtype:float64
Odchylenie standardowe w kolumnie „punkty” wynosi 6,1586 , a odchylenie standardowe w kolumnie „odbicia” wynosi 2,5599 .
Metoda 3: Oblicz odchylenie standardowe wszystkich kolumn liczbowych
Poniższy kod pokazuje, jak obliczyć odchylenie standardowe każdej kolumny liczbowej w ramce DataFrame:
#calculate standard deviation of all numeric columns
df. std ()
points 6.158618
assists 2.549510
rebounds 2.559994
dtype:float64
Należy zauważyć, że pandy nie obliczyły odchylenia standardowego kolumny „zespół”, ponieważ nie była to kolumna liczbowa.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje na pandach:
Jak obliczyć średnią kolumn w Pandach
Jak obliczyć medianę kolumny w Pandach
Jak obliczyć maksymalną wartość kolumn w Pandach