Python'da ondalık sayı nasıl hesaplanır: örneklerle
İstatistikte ondalık sayılar, bir veri kümesini eşit frekansta on gruba bölen sayılardır.
İlk ondalık dilim, tüm veri değerlerinin %10’unun altına düştüğü noktadır. İkinci ondalık dilim, tüm veri değerlerinin %20’sinin altına düştüğü noktadır ve bu böyle devam eder.
Python’da bir veri kümesinin ondalık dilimlerini hesaplamak için aşağıdaki sözdizimini kullanabiliriz:
import numpy as np n.p. percentile (var, np. arange (0, 100, 10))
Aşağıdaki örnekte bu fonksiyonun pratikte nasıl kullanılacağı gösterilmektedir.
Örnek: Python’da ondalık sayıları hesaplama
Aşağıdaki kod, 20 değere sahip sahte bir veri kümesinin nasıl oluşturulacağını ve ardından veri kümesinin ondalık değerlerinin nasıl hesaplanacağını gösterir:
import numpy as np
#createdata
data = np. array ([56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
89, 90, 91, 92, 93, 93, 94, 95, 97, 99])
#calculate deciles of data
n.p. percentile (data, np. arange (0, 100, 10))
array([56., 63.4, 67.8, 76.5, 83.6, 88.5, 90.4, 92.3, 93.2, 95.2])
Ondalık sayıları yorumlamanın yolu aşağıdaki gibidir:
- Tüm veri değerlerinin %10’u 63,4’ten azdır
- Tüm veri değerlerinin %20’si 67,8’den küçüktür.
- Tüm veri değerlerinin %30’u 76,5’tan küçüktür.
- Tüm veri değerlerinin %40’ı 83,6’dan küçüktür.
- Tüm veri değerlerinin %50’si 88,5’ten küçüktür.
- Tüm veri değerlerinin %60’ı 90,4’ten küçüktür.
- Tüm veri değerlerinin %70’i 92,3’ten küçüktür.
- Tüm veri değerlerinin %80’i 93,2’den küçüktür.
- Tüm veri değerlerinin %90’ı 95,2’den küçüktür.
Çıkışın (56) ilk değerinin basitçe veri setinin minimum değerini gösterdiğine dikkat edin.
Örnek: Python’da Değerleri Ondalık Sayıya Yerleştirme
Her veri değerini ondalık dilime yerleştirmek için pandas qcut fonksiyonunu kullanabiliriz.
Önceki örnekte oluşturduğumuz veri kümesi için bu işlevin nasıl kullanılacağı aşağıda açıklanmıştır:
import pandas as pd
#create data frame
df = pd. DataFrame ({' values ': [56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
89, 90, 91, 92, 93, 93, 94, 95, 97, 99]})
#calculate decile of each value in data frame
df[' Decile '] = pd. qcut (df[' values '], 10, labels= False )
#display data frame
df
values Decile
0 56 0
1 58 0
2 64 1
3 67 1
4 68 2
5 73 2
6 78 3
7 83 3
8 84 4
9 88 4
10 89 5
11 90 5
12 91 6
13 92 6
14 93 7
15 93 7
16 94 8
17 95 8
18 97 9
19 99 9
Sonucun yorumlanma şekli şu şekildedir:
- Veri değeri 56, yüzdelik dilim %0 ile %10 arasında olduğundan ondalık dilim 0’dadır .
- Veri değeri 58, yüzdelik dilim %0 ile %10 arasında olduğundan ondalık dilim 0’dadır .
- Veri değeri (64) %10 ila %20 yüzdelik dilim arasındadır, yani ondalık 1’dedir .
- Veri değeri 67, %10 ile %20 yüzdelik dilim arasında yer alır, dolayısıyla ondalık 1’e düşer.
- Veri değeri 68, %20 ila %30 yüzdelik dilim arasında yer alır, dolayısıyla ondalık 2’ye düşer.
Ve benzeri.
Ek kaynaklar
Python’da yüzdelikler nasıl hesaplanır
Python’da çeyrekler arası aralık nasıl hesaplanır