Come calcolare la frequenza relativa in python


La frequenza relativa misura la frequenza con cui un determinato valore appare in un set di dati rispetto al numero totale di valori in un set di dati.

Puoi usare la seguente funzione in Python per calcolare le frequenze relative:

 def rel_freq (x):
freqs = [(value, x.count(value) / len(x)) for value in set(x)]
return freqs

I seguenti esempi mostrano come utilizzare questa funzione nella pratica.

Esempio 1: frequenze relative per un elenco di numeri

Il codice seguente mostra come utilizzare questa funzione per calcolare le frequenze relative di un elenco di numeri:

 #define data
data = [1, 1, 1, 2, 3, 4, 4]

#calculate relative frequencies for each value in list
rel_freq(data)

[(1, 0.42857142857142855),
 (2, 0.14285714285714285),
 (3, 0.14285714285714285),
 (4, 0.2857142857142857)]

Il modo di interpretare questo output è:

  • Il valore “1” ha una frequenza relativa di 0,42857 nel set di dati.
  • Il valore “2” ha una frequenza relativa di 0,142857 nel set di dati.
  • Il valore “3” ha una frequenza relativa di 0,142857 nel set di dati.
  • Il valore “4” ha una frequenza relativa di 0,28571 nel set di dati.

Noterai che tutte le frequenze relative si sommano a 1.

Esempio 2: frequenze relative per un elenco di caratteri

Il codice seguente mostra come utilizzare questa funzione per calcolare le frequenze relative di un elenco di caratteri:

 #define data
data = ['a', 'a', 'b', 'b', 'c']

#calculate relative frequencies for each value in list
rel_freq(data)

[('a', 0.4), ('b', 0.4), ('c', 0.2)]

Il modo di interpretare questo output è:

  • Il valore “a” ha una frequenza relativa di 0,4 nel set di dati.
  • Il valore “b” ha una frequenza relativa di 0,4 nel set di dati.
  • Il valore “c” ha una frequenza relativa di 0,2 nel set di dati.

Ancora una volta, tutte le frequenze relative si sommano a 1.

Esempio 3: frequenze relative per una colonna in un DataFrame panda

Il codice seguente mostra come utilizzare questa funzione per calcolare le frequenze relative per una colonna specifica in un DataFrame panda:

 import pandas as pd

#define data
data = pd.DataFrame({'A': [25, 15, 15, 14, 19],
                     'B': [5, 7, 7, 9, 12],
                     'C': [11, 8, 10, 6, 6]})

#calculate relative frequencies of values in column 'A'
rel_freq( list (data['A']))

[(25, 0.2), (19, 0.2), (14, 0.2), (15, 0.4)]

Il modo di interpretare questo output è:

  • Il valore “25” ha una frequenza relativa di 0,2 nella colonna.
  • Il valore “19” ha una frequenza relativa di 0,2 nella colonna.
  • Il valore “14” ha una frequenza relativa di 0,2 nella colonna.
  • Il valore “15” ha una frequenza relativa di 0,4 nella colonna.

Ancora una volta, tutte le frequenze relative si sommano a 1.

Risorse addizionali

Calcolatore della frequenza relativa
Istogramma della frequenza relativa: definizione + esempio
Come calcolare la frequenza relativa in Excel

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *