Jak obliczyć odchylenie standardowe w pandach: z przykładami

Przez Benjamin Anderson 23 lipca, 2023 Przewodnik 0 komentarzy

Możesz użyć funkcji DataFrame.std() do obliczenia odchylenia standardowego wartości w pandzie DataFrame.

W praktyce do obliczenia odchylenia standardowego można zastosować następujące metody:

Metoda 1: Oblicz odchylenie standardowe kolumny

 df [ ' column_name ' ] . std ( )

Metoda 2: Oblicz odchylenie standardowe wielu kolumn

 df [[ ' column_name1 ', ' column_name2 '] ] . std ( )

Metoda 3: Oblicz odchylenie standardowe wszystkich kolumn liczbowych

 df . std ( )

Należy pamiętać, że funkcja std() automatycznie zignoruje wszelkie wartości NaN w DataFrame podczas obliczania odchylenia standardowego.

Poniższe przykłady pokazują, jak używać każdej metody z następującą ramką DataFrame pand:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

	team points assists rebounds
0 to 25 5 11
1 to 12 7 8
2 B 15 7 10
3 B 14 9 6
4 B 19 12 6
5 B 23 9 5
6 C 25 9 9
7 C 29 4 12

Metoda 1: Oblicz odchylenie standardowe kolumny

Poniższy kod pokazuje, jak obliczyć odchylenie standardowe kolumny w ramce DataFrame:

 #calculate standard deviation of 'points' column
df [ ' points ' ] . std ( )

6.158617655657106

Odchylenie standardowe wynosi 6,1586 .

Metoda 2: Oblicz odchylenie standardowe wielu kolumn

Poniższy kod pokazuje, jak obliczyć odchylenie standardowe wielu kolumn w ramce DataFrame:

 #calculate standard deviation of 'points' and 'rebounds' columns
df[[' points ', ' rebounds ']]. std ()

points 6.158618
rebounds 2.559994
dtype:float64

Odchylenie standardowe w kolumnie „punkty” wynosi 6,1586 , a odchylenie standardowe w kolumnie „odbicia” wynosi 2,5599 .

Metoda 3: Oblicz odchylenie standardowe wszystkich kolumn liczbowych

Poniższy kod pokazuje, jak obliczyć odchylenie standardowe każdej kolumny liczbowej w ramce DataFrame:

 #calculate standard deviation of all numeric columns
df. std ()

points 6.158618
assists 2.549510
rebounds 2.559994
dtype:float64

Należy zauważyć, że pandy nie obliczyły odchylenia standardowego kolumny „zespół”, ponieważ nie była to kolumna liczbowa.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje na pandach:

Jak obliczyć średnią kolumn w Pandach
Jak obliczyć medianę kolumny w Pandach
Jak obliczyć maksymalną wartość kolumn w Pandach

o autorze

Dr Benjamin Anderson

Cześć, jestem Benjamin i jestem emerytowanym profesorem statystyki, który został oddanym nauczycielem Statorials. Dzięki bogatemu doświadczeniu i wiedzy specjalistycznej w dziedzinie statystyki chętnie dzielę się swoją wiedzą, aby wzmocnić pozycję uczniów za pośrednictwem Statorials. Wiedzieć więcej