Comment calculer l’écart type chez les pandas : avec des exemples
Vous pouvez utiliser la fonction DataFrame.std() pour calculer l’écart type des valeurs dans un DataFrame pandas.
Vous pouvez utiliser les méthodes suivantes pour calculer l’écart type dans la pratique :
Méthode 1 : calculer l’écart type d’une colonne
df['column_name'].std()
Méthode 2 : calculer l’écart type de plusieurs colonnes
df[['column_name1', 'column_name2']].std()
Méthode 3 : calculer l’écart type de toutes les colonnes numériques
df.std()
Notez que la fonction std() ignorera automatiquement toutes les valeurs NaN dans le DataFrame lors du calcul de l’écart type.
Les exemples suivants montrent comment utiliser chaque méthode avec le DataFrame pandas suivant :
import pandas as pd #create DataFrame df = pd.DataFrame({'team': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'], 'points': [25, 12, 15, 14, 19, 23, 25, 29], 'assists': [5, 7, 7, 9, 12, 9, 9, 4], 'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame print(df) team points assists rebounds 0 A 25 5 11 1 A 12 7 8 2 B 15 7 10 3 B 14 9 6 4 B 19 12 6 5 B 23 9 5 6 C 25 9 9 7 C 29 4 12
Méthode 1 : calculer l’écart type d’une colonne
Le code suivant montre comment calculer l’écart type d’une colonne du DataFrame :
#calculate standard deviation of 'points' column df['points'].std() 6.158617655657106
L’écart type s’avère être de 6,1586 .
Méthode 2 : calculer l’écart type de plusieurs colonnes
Le code suivant montre comment calculer l’écart type de plusieurs colonnes dans le DataFrame :
#calculate standard deviation of 'points' and 'rebounds' columns
df[['points', 'rebounds']].std()
points 6.158618
rebounds 2.559994
dtype: float64
L’écart type de la colonne « points » est de 6,1586 et l’écart type de la colonne « rebonds » est de 2,5599 .
Méthode 3 : calculer l’écart type de toutes les colonnes numériques
Le code suivant montre comment calculer l’écart type de chaque colonne numérique du DataFrame :
#calculate standard deviation of all numeric columns
df.std()
points 6.158618
assists 2.549510
rebounds 2.559994
dtype: float64
Notez que les pandas n’ont pas calculé l’écart type de la colonne « équipe » puisqu’il ne s’agissait pas d’une colonne numérique.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :
Comment calculer la moyenne des colonnes dans Pandas
Comment calculer la médiane des colonnes dans Pandas
Comment calculer la valeur maximale des colonnes dans Pandas