Comment calculer l’écart type chez les pandas : avec des exemples



Vous pouvez utiliser la fonction DataFrame.std() pour calculer l’écart type des valeurs dans un DataFrame pandas.

Vous pouvez utiliser les méthodes suivantes pour calculer l’écart type dans la pratique :

Méthode 1 : calculer l’écart type d’une colonne

df['column_name'].std() 

Méthode 2 : calculer l’écart type de plusieurs colonnes

df[['column_name1', 'column_name2']].std() 

Méthode 3 : calculer l’écart type de toutes les colonnes numériques

df.std() 

Notez que la fonction std() ignorera automatiquement toutes les valeurs NaN dans le DataFrame lors du calcul de l’écart type.

Les exemples suivants montrent comment utiliser chaque méthode avec le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'],
                   'points': [25, 12, 15, 14, 19, 23, 25, 29],
                   'assists': [5, 7, 7, 9, 12, 9, 9, 4],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print(df)

	team	points	assists	rebounds
0	A	25	5	11
1	A	12	7	8
2	B	15	7	10
3	B	14	9	6
4	B	19	12	6
5	B	23	9	5
6	C	25	9	9
7	C	29	4	12

Méthode 1 : calculer l’écart type d’une colonne

Le code suivant montre comment calculer l’écart type d’une colonne du DataFrame :

#calculate standard deviation of 'points' column
df['points'].std() 

6.158617655657106

L’écart type s’avère être de 6,1586 .

Méthode 2 : calculer l’écart type de plusieurs colonnes

Le code suivant montre comment calculer l’écart type de plusieurs colonnes dans le DataFrame :

#calculate standard deviation of 'points' and 'rebounds' columns
df[['points', 'rebounds']].std()

points      6.158618
rebounds    2.559994
dtype: float64

L’écart type de la colonne « points » est de 6,1586 et l’écart type de la colonne « rebonds » est de 2,5599 .

Méthode 3 : calculer l’écart type de toutes les colonnes numériques

Le code suivant montre comment calculer l’écart type de chaque colonne numérique du DataFrame :

#calculate standard deviation of all numeric columns
df.std()

points      6.158618
assists     2.549510
rebounds    2.559994
dtype: float64

Notez que les pandas n’ont pas calculé l’écart type de la colonne « équipe » puisqu’il ne s’agissait pas d’une colonne numérique.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Comment calculer la moyenne des colonnes dans Pandas
Comment calculer la médiane des colonnes dans Pandas
Comment calculer la valeur maximale des colonnes dans Pandas

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *