Pandalar: belirli yüzdeliklerle define() nasıl kullanılır?
Bir pandanın DataFrame’indeki değişkenler için tanımlayıcı istatistikler oluşturmak amacıyla define() işlevini kullanabilirsiniz.
Varsayılan olarak pandalar değişkenler için 25., 50. ve 75. yüzdelikleri hesaplar.
Ancak, hesaplanacak yüzdelik dilimleri tam olarak belirtmek için define() işlevindeki yüzdelik bağımsız değişkenini kullanabilirsiniz.
Aşağıdaki örnekler, bu argümanın pratikte aşağıdaki pandalar DataFrame ile nasıl kullanılacağını gösterir:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
' points ': [18, 22, 19, 14, 14, 11, 20, 28],
' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#view DataFrame
print (df)
team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12
Örnek 1: Tanımla() işlevini varsayılan yüzdelik dilimlerle kullanma
Aşağıdaki kod, DataFrame’deki her bir sayısal değişken için tanımlayıcı istatistikleri hesaplamak amacıyla define() işlevinin nasıl kullanılacağını gösterir:
#calculate descriptive statistics for each numeric variable
df. describe ()
points assists rebounds
count 8.000000 8.00000 8.000000
mean 18.250000 7.75000 8.375000
std 5.365232 2.54951 2.559994
min 11.000000 4.00000 5.000000
25% 14,000000 6,50000 6,000000
50% 18.500000 8.00000 8.500000
75% 20.500000 9.00000 10.250000
max 28.000000 12.00000 12.000000
Açıklama() işlevinin varsayılan olarak her değişken için 25., 50. ve 75. yüzdelik dilimleri hesapladığını unutmayın.
Örnek 2: define() işlevini özel yüzdelik dilimlerle kullanma
Aşağıdaki kod, DataFrame’deki her sayısal değişken için 30., 60. ve 90. yüzdelik dilimleri hesaplamak üzere, yüzdelik bağımsız değişkeniyle define() işlevinin nasıl kullanılacağını gösterir:
#calculate custom percentiles for each numeric variable
df. describe (percentiles=[ .3 , .6 , .9 ])
points assists rebounds
count 8.000000 8.00000 8.000000
mean 18.250000 7.75000 8.375000
std 5.365232 2.54951 2.559994
min 11.000000 4.00000 5.000000
30% 14.400000 7.00000 6.200000
50% 18.500000 8.00000 8.500000
60% 19.200000 9.00000 9.200000
90% 23.800000 9.90000 11.300000
max 28.000000 12.00000 12.000000
define() fonksiyonunun her sayısal değişken için 30., 60. ve 90. yüzdelikleri döndürdüğünü unutmayın.
Not : Açıklama() işlevi aynı zamanda 50. yüzdelik değeri de döndürür çünkü bu, her değişkenin ortanca değerini temsil eder ve açıkla() işlevi tarafından hesaplanan varsayılan ölçümlerden biridir.
Örnek 3: Yüzdelik değer olmadan define() işlevinin kullanılması
Aşağıdaki kod, DataFrame’deki her sayısal değişken için hiçbir yüzdelik değeri hesaplamak amacıyla , define() işlevinin yüzdelikler=[] bağımsız değişkeniyle nasıl kullanılacağını gösterir:
#calculate no percentiles for each numeric variable
df. describe (percentiles=[])
points assists rebounds
count 8.000000 8.00000 8.000000
mean 18.250000 7.75000 8.375000
std 5.365232 2.54951 2.559994
min 11.000000 4.00000 5.000000
50% 18.500000 8.00000 8.500000
max 28.000000 12.00000 12.000000
Artık her değişken için 25. ve 75. yüzdelik dilimlerin hesaplanmadığını unutmayın.
Her değişkenin medyan değerini temsil ettiğinden 50. yüzdelik dilimin her zaman sonuca dahil edildiğini unutmayın.
Ek kaynaklar
Aşağıdaki eğitimlerde pandalarda diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:
Pandalar: gruplara göre define() nasıl kullanılır?
Pandalar: define() nasıl kullanılır ve bilimsel gösterim nasıl kaldırılır
Pandalar: ortalama, medyan ve mod nasıl hesaplanır