Comment calculer la fréquence relative en Python
La fréquence relative mesure la fréquence à laquelle une certaine valeur apparaît dans un ensemble de données par rapport au nombre total de valeurs dans un ensemble de données.
Vous pouvez utiliser la fonction suivante en Python pour calculer les fréquences relatives :
def rel_freq(x): freqs = [(value, x.count(value) / len(x)) for value in set(x)] return freqs
Les exemples suivants montrent comment utiliser cette fonction dans la pratique.
Exemple 1 : Fréquences relatives pour une liste de nombres
Le code suivant montre comment utiliser cette fonction pour calculer les fréquences relatives d’une liste de nombres :
#define data data = [1, 1, 1, 2, 3, 4, 4] #calculate relative frequencies for each value in list rel_freq(data) [(1, 0.42857142857142855), (2, 0.14285714285714285), (3, 0.14285714285714285), (4, 0.2857142857142857)]
La façon d’interpréter cette sortie est la suivante :
- La valeur « 1 » a une fréquence relative de 0,42857 dans l’ensemble de données.
- La valeur « 2 » a une fréquence relative de 0,142857 dans l’ensemble de données.
- La valeur « 3 » a une fréquence relative de 0,142857 dans l’ensemble de données.
- La valeur « 4 » a une fréquence relative de 0,28571 dans l’ensemble de données.
Vous remarquerez que toutes les fréquences relatives totalisent 1.
Exemple 2 : Fréquences relatives pour une liste de caractères
Le code suivant montre comment utiliser cette fonction pour calculer les fréquences relatives d’une liste de caractères :
#define data data = ['a', 'a', 'b', 'b', 'c'] #calculate relative frequencies for each value in list rel_freq(data) [('a', 0.4), ('b', 0.4), ('c', 0.2)]
La façon d’interpréter cette sortie est la suivante :
- La valeur « a » a une fréquence relative de 0,4 dans l’ensemble de données.
- La valeur «b» a une fréquence relative de 0,4 dans l’ensemble de données.
- La valeur «c» a une fréquence relative de 0,2 dans l’ensemble de données.
Encore une fois, toutes les fréquences relatives totalisent 1.
Exemple 3 : Fréquences relatives pour une colonne dans un DataFrame pandas
Le code suivant montre comment utiliser cette fonction pour calculer les fréquences relatives pour une colonne spécifique dans un DataFrame pandas :
import pandas as pd #define data data = pd.DataFrame({'A': [25, 15, 15, 14, 19], 'B': [5, 7, 7, 9, 12], 'C': [11, 8, 10, 6, 6]}) #calculate relative frequencies of values in column 'A' rel_freq(list(data['A'])) [(25, 0.2), (19, 0.2), (14, 0.2), (15, 0.4)]
La façon d’interpréter cette sortie est la suivante :
- La valeur « 25 » a une fréquence relative de 0,2 dans la colonne.
- La valeur « 19 » a une fréquence relative de 0,2 dans la colonne.
- La valeur « 14 » a une fréquence relative de 0,2 dans la colonne.
- La valeur « 15 » a une fréquence relative de 0,4 dans la colonne.
Encore une fois, toutes les fréquences relatives totalisent 1.
Ressources additionnelles
Calculateur de fréquence relative
Histogramme de fréquence relative : définition + exemple
Comment calculer la fréquence relative dans Excel