Como calcular a frequência relativa em python


A frequência relativa mede a frequência com que um determinado valor aparece em um conjunto de dados em relação ao número total de valores em um conjunto de dados.

Você pode usar a seguinte função em Python para calcular frequências relativas:

 def rel_freq (x):
freqs = [(value, x.count(value) / len(x)) for value in set(x)]
return freqs

Os exemplos a seguir mostram como usar esta função na prática.

Exemplo 1: Frequências relativas para uma lista de números

O código a seguir mostra como usar esta função para calcular as frequências relativas de uma lista de números:

 #define data
data = [1, 1, 1, 2, 3, 4, 4]

#calculate relative frequencies for each value in list
rel_freq(data)

[(1, 0.42857142857142855),
 (2, 0.14285714285714285),
 (3, 0.14285714285714285),
 (4, 0.2857142857142857)]

A maneira de interpretar esta saída é:

  • O valor “1” tem frequência relativa de 0,42857 no conjunto de dados.
  • O valor “2” tem frequência relativa de 0,142857 no conjunto de dados.
  • O valor “3” tem frequência relativa de 0,142857 no conjunto de dados.
  • O valor “4” tem frequência relativa de 0,28571 no conjunto de dados.

Você notará que todas as frequências relativas somam 1.

Exemplo 2: Frequências relativas para uma lista de caracteres

O código a seguir mostra como usar esta função para calcular as frequências relativas de uma lista de caracteres:

 #define data
data = ['a', 'a', 'b', 'b', 'c']

#calculate relative frequencies for each value in list
rel_freq(data)

[('a', 0.4), ('b', 0.4), ('c', 0.2)]

A maneira de interpretar esta saída é:

  • O valor “a” tem frequência relativa de 0,4 no conjunto de dados.
  • O valor “b” tem frequência relativa de 0,4 no conjunto de dados.
  • O valor “c” tem frequência relativa de 0,2 no conjunto de dados.

Novamente, todas as frequências relativas somam 1.

Exemplo 3: frequências relativas para uma coluna em um DataFrame do pandas

O código a seguir mostra como usar esta função para calcular frequências relativas para uma coluna específica em um DataFrame do pandas:

 import pandas as pd

#define data
data = pd.DataFrame({'A': [25, 15, 15, 14, 19],
                     'B': [5, 7, 7, 9, 12],
                     'C': [11, 8, 10, 6, 6]})

#calculate relative frequencies of values in column 'A'
rel_freq( list (data['A']))

[(25, 0.2), (19, 0.2), (14, 0.2), (15, 0.4)]

A maneira de interpretar esta saída é:

  • O valor “25” tem frequência relativa de 0,2 na coluna.
  • O valor “19” tem frequência relativa de 0,2 na coluna.
  • O valor “14” tem frequência relativa de 0,2 na coluna.
  • O valor “15” tem frequência relativa de 0,4 na coluna.

Novamente, todas as frequências relativas somam 1.

Recursos adicionais

Calculadora de frequência relativa
Histograma de frequência relativa: definição + exemplo
Como calcular a frequência relativa no Excel

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *