Comment calculer la fréquence relative en Python



La fréquence relative mesure la fréquence à laquelle une certaine valeur apparaît dans un ensemble de données par rapport au nombre total de valeurs dans un ensemble de données.

Vous pouvez utiliser la fonction suivante en Python pour calculer les fréquences relatives :

def rel_freq(x):
    freqs = [(value, x.count(value) / len(x)) for value in set(x)] 
    return freqs

Les exemples suivants montrent comment utiliser cette fonction dans la pratique.

Exemple 1 : Fréquences relatives pour une liste de nombres

Le code suivant montre comment utiliser cette fonction pour calculer les fréquences relatives d’une liste de nombres :

#define data
data = [1, 1, 1, 2, 3, 4, 4]

#calculate relative frequencies for each value in list
rel_freq(data)

[(1, 0.42857142857142855),
 (2, 0.14285714285714285),
 (3, 0.14285714285714285),
 (4, 0.2857142857142857)]

La façon d’interpréter cette sortie est la suivante :

  • La valeur « 1 » a une fréquence relative de 0,42857 dans l’ensemble de données.
  • La valeur « 2 » a une fréquence relative de 0,142857 dans l’ensemble de données.
  • La valeur « 3 » a une fréquence relative de 0,142857 dans l’ensemble de données.
  • La valeur « 4 » a une fréquence relative de 0,28571 dans l’ensemble de données.

Vous remarquerez que toutes les fréquences relatives totalisent 1.

Exemple 2 : Fréquences relatives pour une liste de caractères

Le code suivant montre comment utiliser cette fonction pour calculer les fréquences relatives d’une liste de caractères :

#define data
data = ['a', 'a', 'b', 'b', 'c']

#calculate relative frequencies for each value in list
rel_freq(data)

[('a', 0.4), ('b', 0.4), ('c', 0.2)]

La façon d’interpréter cette sortie est la suivante :

  • La valeur « a » a une fréquence relative de 0,4 dans l’ensemble de données.
  • La valeur «b» a une fréquence relative de 0,4 dans l’ensemble de données.
  • La valeur «c» a une fréquence relative de 0,2 dans l’ensemble de données.

Encore une fois, toutes les fréquences relatives totalisent 1.

Exemple 3 : Fréquences relatives pour une colonne dans un DataFrame pandas

Le code suivant montre comment utiliser cette fonction pour calculer les fréquences relatives pour une colonne spécifique dans un DataFrame pandas :

import pandas as pd

#define data
data = pd.DataFrame({'A': [25, 15, 15, 14, 19],
                     'B': [5, 7, 7, 9, 12],
                     'C': [11, 8, 10, 6, 6]})

#calculate relative frequencies of values in column 'A'
rel_freq(list(data['A']))

[(25, 0.2), (19, 0.2), (14, 0.2), (15, 0.4)]

La façon d’interpréter cette sortie est la suivante :

  • La valeur « 25 » a une fréquence relative de 0,2 dans la colonne.
  • La valeur « 19 » a une fréquence relative de 0,2 dans la colonne.
  • La valeur « 14 » a une fréquence relative de 0,2 dans la colonne.
  • La valeur « 15 » a une fréquence relative de 0,4 dans la colonne.

Encore une fois, toutes les fréquences relatives totalisent 1.

Ressources additionnelles

Calculateur de fréquence relative
Histogramme de fréquence relative : définition + exemple
Comment calculer la fréquence relative dans Excel

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *