Python'da göreli frekans nasıl hesaplanır?


Göreli sıklık, bir veri kümesindeki toplam değer sayısına göre belirli bir değerin bir veri kümesinde ne sıklıkta göründüğünü ölçer.

Göreceli frekansları hesaplamak için Python’da aşağıdaki işlevi kullanabilirsiniz:

 def rel_freq (x):
freqs = [(value, x.count(value) / len(x)) for value in set(x)]
return freqs

Aşağıdaki örnekler bu fonksiyonun pratikte nasıl kullanılacağını göstermektedir.

Örnek 1: Bir sayı listesi için göreceli frekanslar

Aşağıdaki kod, bir sayı listesinin göreli frekanslarını hesaplamak için bu işlevin nasıl kullanılacağını gösterir:

 #define data
data = [1, 1, 1, 2, 3, 4, 4]

#calculate relative frequencies for each value in list
rel_freq(data)

[(1, 0.42857142857142855),
 (2, 0.14285714285714285),
 (3, 0.14285714285714285),
 (4, 0.2857142857142857)]

Bu çıktıyı yorumlamanın yolu şudur:

  • “1” değeri veri setinde 0,42857 bağıl frekansına sahiptir.
  • “2” değeri veri setinde 0,142857 bağıl frekansına sahiptir.
  • “3” değeri veri setinde 0,142857 bağıl frekansına sahiptir.
  • “4” değeri veri setinde 0,28571 bağıl frekansına sahiptir.

Tüm göreceli frekansların toplamının 1’e eşit olduğunu fark edeceksiniz.

Örnek 2: Bir karakter listesi için göreceli frekanslar

Aşağıdaki kod, bir karakter listesinin göreli sıklıklarını hesaplamak için bu işlevin nasıl kullanılacağını gösterir:

 #define data
data = ['a', 'a', 'b', 'b', 'c']

#calculate relative frequencies for each value in list
rel_freq(data)

[('a', 0.4), ('b', 0.4), ('c', 0.2)]

Bu çıktıyı yorumlamanın yolu şudur:

  • “a” değeri veri setinde 0,4 bağıl frekansa sahiptir.
  • “b” değeri veri setinde 0,4 bağıl frekansa sahiptir.
  • “c” değeri veri setinde 0,2 bağıl frekansa sahiptir.

Yine tüm göreceli frekansların toplamı 1’e eşittir.

Örnek 3: Pandas DataFrame’deki bir sütunun göreli frekansları

Aşağıdaki kod, bir pandas DataFrame’deki belirli bir sütunun göreli frekanslarını hesaplamak için bu işlevin nasıl kullanılacağını gösterir:

 import pandas as pd

#define data
data = pd.DataFrame({'A': [25, 15, 15, 14, 19],
                     'B': [5, 7, 7, 9, 12],
                     'C': [11, 8, 10, 6, 6]})

#calculate relative frequencies of values in column 'A'
rel_freq( list (data['A']))

[(25, 0.2), (19, 0.2), (14, 0.2), (15, 0.4)]

Bu çıktıyı yorumlamanın yolu şudur:

  • “25” değeri sütunda 0,2’lik bağıl frekansa sahiptir.
  • “19” değeri sütunda 0,2 bağıl frekansa sahiptir.
  • “14” değeri sütunda 0,2 bağıl frekansa sahiptir.
  • “15” değeri sütunda 0,4 bağıl frekansa sahiptir.

Yine tüm göreceli frekansların toplamı 1’e eşittir.

Ek kaynaklar

Bağıl frekans hesaplayıcı
Göreli frekans histogramı: tanım + örnek
Excel’de Göreli Frekans Nasıl Hesaplanır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir