Python'da yüzdelik değerler nasıl hesaplanır: örneklerle
Bir veri kümesinin n’inci yüzdelik dilimi, tüm değerler en küçükten en büyüğe doğru sıralandığında veri değerlerinin en üst yüzde n’lik kısmını kesen değerdir.
Örneğin, bir veri kümesinin 90’ıncı yüzdelik dilimi, veri değerlerinin alt %90’ını veri değerlerinin üst %10’undan ayıran değerdir.
Aşağıdaki sözdizimini kullanan numpy.percentile() işlevini kullanarak Python’da yüzdelik dilimleri hızlı bir şekilde hesaplayabiliriz:
numpy.percentile(a, q)
Altın:
- a: Değerler tablosu
- q: Hesaplanacak yüzdelik dilim veya yüzdelik dizisi; bunların 0 ile 100 arasında olması gerekir.
Bu eğitimde Python’da yüzdelik değerleri hesaplamak için bu işlevin nasıl kullanılacağı açıklanmaktadır.
Bir tablonun yüzdelik dilimleri nasıl bulunur?
Aşağıdaki kod Python’da belirli bir dizi için farklı yüzdelik değerlerin nasıl bulunacağını gösterir:
import numpy as np #make this example reproducible n.p. random . seeds (0) #create array of 100 random integers distributed between 0 and 500 data = np. random . randint (0, 500, 100) #find the 37th percentile of the array n.p. percentile (data, 37) 173.26 #Find the quartiles (25th, 50th, and 75th percentiles) of the array n.p. percentile (data, [25, 50, 75]) array([116.5, 243.5, 371.5])
DataFrame sütununun yüzdelik dilimleri nasıl bulunur?
Aşağıdaki kod, tek bir pandas DataFrame sütunu için 95. yüzdelik değerin nasıl bulunacağını gösterir:
import numpy as np
import pandas as pd
#createDataFrame
df = pd.DataFrame({'var1': [25, 12, 15, 14, 19, 23, 25, 29, 33, 35],
'var2': [5, 7, 7, 9, 12, 9, 9, 4, 14, 15],
'var3': [11, 8, 10, 6, 6, 5, 9, 12, 13, 16]})
#find 90th percentile of var1 column
n.p. percentile (df. var1 , 95)
34.1
Birden çok DataFrame sütununun yüzdelik dilimleri nasıl bulunur?
Aşağıdaki kod, bir pandas DataFrame’de birden çok sütun için 95. yüzdelik değerin nasıl bulunacağını gösterir:
import numpy as np
import pandas as pd
#createDataFrame
df = pd.DataFrame({'var1': [25, 12, 15, 14, 19, 23, 25, 29, 33, 35],
'var2': [5, 7, 7, 9, 12, 9, 9, 4, 14, 15],
'var3': [11, 8, 10, 6, 6, 5, 9, 12, 13, 16]})
#find 95th percentile of each column
df. quantile (.95)
var1 34.10
var2 14.55
var3 14.65
#find 95th percentile of just columns var1 and var2
df[[' var1 ', ' var2 ']]. quantile (.95)
var1 34.10
var2 14.55
Yukarıdaki örneklerde yüzdelik değerleri hesaplamak için pandas quantile() işlevini kullanabileceğimizi unutmayın.
İlgili: R’de Yüzdelik Değerler Nasıl Hesaplanır (Örneklerle)