Pandas : Comment obtenir le nombre de fréquences des valeurs dans une colonne
Vous pouvez utiliser les méthodes suivantes pour obtenir la fréquence des valeurs dans une colonne d’un DataFrame pandas :
Méthode 1 : obtenir le nombre de fréquences des valeurs sous forme de tableau
df['my_column'].value_counts()
Méthode 2 : obtenir le nombre de fréquences des valeurs au format dictionnaire
df['my_column'].value_counts().to_dict()
Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le DataFrame pandas suivant :
import pandas as pd #create DataFrame df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'C'], 'points': [12, 20, 25, 8, 12, 19, 27, 35]}) #view DataFrame print(df) team points 0 A 12 1 A 20 2 A 25 3 A 8 4 B 12 5 B 19 6 B 27 7 C 35
Exemple 1 : obtenir le nombre de fréquences des valeurs sous forme de tableau
Nous pouvons utiliser la fonction value_counts() pour obtenir un décompte de fréquence de chaque valeur unique dans la colonne équipe du DataFrame et afficher les résultats sous forme de tableau :
#get frequency count of values in 'team' column df['team'].value_counts() A 4 B 3 C 1 Name: team, dtype: int64
D’après les résultats, nous pouvons voir :
- La valeur ‘A’ apparaît 4 fois dans la colonne équipe.
- La valeur ‘B’ apparaît 3 fois dans la colonne équipe.
- La valeur ‘C’ apparaît 1 fois dans la colonne équipe.
Notez que les résultats sont affichés sous forme de tableau.
Exemple 2 : obtenir le nombre de fréquences des valeurs au format dictionnaire
Nous pouvons utiliser la fonction value_counts() et la fonction to_dict() pour obtenir un décompte de fréquence de chaque valeur unique dans la colonne équipe du DataFrame et afficher les résultats dans un format de dictionnaire :
#get frequency count of values in 'team' column and display in dictionary df['team'].value_counts().to_dict() {'A': 4, 'B': 3, 'C': 1}
Les décomptes de fréquence de chaque valeur unique dans la colonne d’équipe sont affichés sous forme de dictionnaire.
Par exemple, nous pouvons voir :
- La valeur ‘A’ apparaît 4 fois dans la colonne équipe.
- La valeur ‘B’ apparaît 3 fois dans la colonne équipe.
- La valeur ‘C’ apparaît 1 fois dans la colonne équipe.
Cela correspond aux décomptes de fréquence de la méthode précédente.
Les résultats sont simplement affichés dans un format différent.
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans les pandas :
Pandas : comment utiliser GroupBy et les décomptes de valeurs
Pandas : Comment utiliser GroupBy avec le nombre de bacs
Pandas : Comment compter les valeurs dans une colonne avec condition