Come calcolare la deviazione standard nei panda: con esempi


È possibile utilizzare la funzione DataFrame.std() per calcolare la deviazione standard dei valori in un DataFrame panda.

Nella pratica è possibile utilizzare i seguenti metodi per calcolare la deviazione standard:

Metodo 1: Calcola la deviazione standard di una colonna

 df [ ' column_name ' ] . std ( )

Metodo 2: calcola la deviazione standard di più colonne

 df [[ ' column_name1 ', ' column_name2 '] ] . std ( )

Metodo 3: calcola la deviazione standard di tutte le colonne numeriche

 df . std ( )

Tieni presente che la funzione std() ignorerà automaticamente qualsiasi valore NaN nel DataFrame durante il calcolo della deviazione standard.

Gli esempi seguenti mostrano come utilizzare ciascun metodo con i seguenti DataFrame panda:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

	team points assists rebounds
0 to 25 5 11
1 to 12 7 8
2 B 15 7 10
3 B 14 9 6
4 B 19 12 6
5 B 23 9 5
6 C 25 9 9
7 C 29 4 12

Metodo 1: Calcola la deviazione standard di una colonna

Il codice seguente mostra come calcolare la deviazione standard di una colonna nel DataFrame:

 #calculate standard deviation of 'points' column
df [ ' points ' ] . std ( )

6.158617655657106

La deviazione standard risulta essere 6.1586 .

Metodo 2: calcola la deviazione standard di più colonne

Il codice seguente mostra come calcolare la deviazione standard di più colonne nel DataFrame:

 #calculate standard deviation of 'points' and 'rebounds' columns
df[[' points ', ' rebounds ']]. std ()

points 6.158618
rebounds 2.559994
dtype:float64

La deviazione standard della colonna “punti” è 6.1586 e la deviazione standard della colonna “rimbalzi” è 2.5599 .

Metodo 3: calcola la deviazione standard di tutte le colonne numeriche

Il codice seguente mostra come calcolare la deviazione standard di ciascuna colonna numerica nel DataFrame:

 #calculate standard deviation of all numeric columns
df. std ()

points 6.158618
assists 2.549510
rebounds 2.559994
dtype:float64

Tieni presente che i panda non hanno calcolato la deviazione standard della colonna “squadra” poiché non era una colonna numerica.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre operazioni comuni nei panda:

Come calcolare la media delle colonne in Pandas
Come calcolare la mediana delle colonne in Pandas
Come calcolare il valore massimo delle colonne in Pandas

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *