Vous pouvez utiliser la syntaxe de base suivante pour compter le nombre d’éléments égal à NaN dans un tableau NumPy : import numpy as np np.count_nonzero(np.isnan(my_array)) Cet exemple particulier renverra le nombre d’éléments égal à NaN dans le tableau NumPy appelé my_array...
Vous pouvez utiliser la syntaxe de base suivante pour compter le nombre d’éléments supérieurs à une valeur spécifique dans un tableau NumPy : import numpy as np vals_greater_10 = (data > 10).sum() Cet exemple particulier renverra le nombre d’éléments supérieur à 10...
Vous pouvez utiliser la syntaxe de base suivante pour créer un graphique à barres dans pandas qui inclut uniquement les 10 valeurs les plus fréquentes dans une colonne spécifique : import pandas as pd import matplotlib.pyplot as plt #find values with top...
Vous pouvez utiliser l’argument normalize dans la fonction pandas crosstab() pour créer un tableau croisé qui affiche des valeurs en pourcentage au lieu de nombres : pd.crosstab(df.col1, df.col2, normalize='index') L’argument normaliser accepte trois arguments différents : all : Afficher le pourcentage par rapport...
Vous pouvez utiliser l’argument aggfunc dans la fonction pandas crosstab() pour créer un tableau croisé qui agrège les valeurs à l’aide d’une métrique spécifique : pd.crosstab(index=df.col1, columns=df.col2, values=df.col3, aggfunc='count') La valeur par défaut de aggfunc est « count », mais vous pouvez spécifier d’autres...
Vous pouvez utiliser les méthodes suivantes pour créer un graphique à barres afin de visualiser les décomptes dans un tableau croisé Pandas : Méthode 1 : créer un tracé à barres groupées import matplotlib.pyplot as plt my_crosstab.plot(kind='bar') Méthode 2 : créer un tracé à barres empilées...
Vous pouvez utiliser les méthodes suivantes pour trier les lignes ou les colonnes dans un tableau croisé Pandas : Méthode 1 : Trier le tableau croisé par valeurs de ligne pd.crosstab(df.col1, df.col2).sort_index(axis=0, ascending=False) Méthode 2 : Trier le tableau croisé par valeurs de colonne...
Vous pouvez utiliser la syntaxe suivante pour utiliser la fonction query() dans les pandas et référencer un nom de variable : df.query('team == @team_name') Cette requête particulière recherche des lignes dans un DataFrame pandas où la colonne team est égale à la...
Souvent, vous souhaiterez peut-être utiliser la fonction isin() dans la méthode query() dans les pandas pour filtrer les lignes d’un DataFrame où une colonne contient une valeur dans une liste. Vous pouvez utiliser la syntaxe suivante pour ce faire : df.query('team in...
Vous pouvez utiliser la syntaxe de base suivante avec la fonction groupby() dans pandas pour regrouper par deux colonnes et agréger une autre colonne : df.groupby(['var1', 'var2'])['var3'].mean() Cet exemple particulier regroupe le DataFrame par les colonnes var1 et var2 , puis calcule...