Come calcolare la deviazione standard nei panda: con esempi
È possibile utilizzare la funzione DataFrame.std() per calcolare la deviazione standard dei valori in un DataFrame panda.
Nella pratica è possibile utilizzare i seguenti metodi per calcolare la deviazione standard:
Metodo 1: Calcola la deviazione standard di una colonna
df [ ' column_name ' ] . std ( )
Metodo 2: calcola la deviazione standard di più colonne
df [[ ' column_name1 ', ' column_name2 '] ] . std ( )
Metodo 3: calcola la deviazione standard di tutte le colonne numeriche
df . std ( )
Tieni presente che la funzione std() ignorerà automaticamente qualsiasi valore NaN nel DataFrame durante il calcolo della deviazione standard.
Gli esempi seguenti mostrano come utilizzare ciascun metodo con i seguenti DataFrame panda:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print (df) team points assists rebounds 0 to 25 5 11 1 to 12 7 8 2 B 15 7 10 3 B 14 9 6 4 B 19 12 6 5 B 23 9 5 6 C 25 9 9 7 C 29 4 12
Metodo 1: Calcola la deviazione standard di una colonna
Il codice seguente mostra come calcolare la deviazione standard di una colonna nel DataFrame:
#calculate standard deviation of 'points' column df [ ' points ' ] . std ( ) 6.158617655657106
La deviazione standard risulta essere 6.1586 .
Metodo 2: calcola la deviazione standard di più colonne
Il codice seguente mostra come calcolare la deviazione standard di più colonne nel DataFrame:
#calculate standard deviation of 'points' and 'rebounds' columns
df[[' points ', ' rebounds ']]. std ()
points 6.158618
rebounds 2.559994
dtype:float64
La deviazione standard della colonna “punti” è 6.1586 e la deviazione standard della colonna “rimbalzi” è 2.5599 .
Metodo 3: calcola la deviazione standard di tutte le colonne numeriche
Il codice seguente mostra come calcolare la deviazione standard di ciascuna colonna numerica nel DataFrame:
#calculate standard deviation of all numeric columns
df. std ()
points 6.158618
assists 2.549510
rebounds 2.559994
dtype:float64
Tieni presente che i panda non hanno calcolato la deviazione standard della colonna “squadra” poiché non era una colonna numerica.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre operazioni comuni nei panda:
Come calcolare la media delle colonne in Pandas
Come calcolare la mediana delle colonne in Pandas
Come calcolare il valore massimo delle colonne in Pandas