Pandalarda koşullu ortalama nasıl hesaplanır (örneklerle)
Pandalarda koşullu ortalamayı hesaplamak için aşağıdaki sözdizimini kullanabilirsiniz:
df. loc [df[' team '] == ' A ', ' points ']. mean ()
Bu, DataFrame’deki “ekip” sütununun “A”ya eşit olduğu her satır için “puan” sütununun ortalamasını hesaplar.
Aşağıdaki örnekler, bu sözdiziminin pratikte aşağıdaki pandalar DataFrame ile nasıl kullanılacağını gösterir:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B'],
' points ': [99, 90, 93, 86, 88, 82],
' assists ': [33, 28, 31, 39, 34, 30]})
#view DataFrame
print (df)
team points assists
0 to 99 33
1 A 90 28
2 A 93 31
3 B 86 39
4 B 88 34
5 B 82 30
Örnek 1: Kategorik Bir Değişkenin Koşullu Ortalamasını Hesaplama
Aşağıdaki kod, yalnızca “ekip” sütununun “A” değerine sahip olduğu DataFrame’deki satırlar için “puan” sütununun ortalamasının nasıl hesaplanacağını gösterir.
#calculate mean of 'points' column for rows where team equals 'A'
df. loc [df[' team '] == ' A ', ' points ']. mean ()
94.0
“Takım”ın “A”ya eşit olduğu satırlar için “puan” sütunundaki ortalama değer 94’tür .
Yalnızca “takım”ın “A”ya eşit olduğu satırlar için puan değerlerinin ortalamasını alarak bunu manuel olarak kontrol edebiliriz:
- Ortalama puanlar: (99 + 90 + 93) / 3 = 94
Örnek 2: Sayısal Bir Değişkenin Koşullu Ortalamasını Hesaplama
Aşağıdaki kod, “destek” sütununun ortalamasının yalnızca DataFrame’deki “puan” sütununun 90’dan büyük veya ona eşit bir değere sahip olduğu satırlar için nasıl hesaplanacağını gösterir.
#calculate mean of 'assists' column for rows where 'points' >= 90
df. loc [df[' points '] >= 90 , ' assists ']. mean ()
30.666666666666668
“Puanların” 90’dan büyük veya ona eşit olduğu satırlar için “asist” sütunundaki ortalama değer 30,66667’dir .
Yalnızca “takım”ın “A”ya eşit olduğu satırlar için puan değerlerinin ortalamasını alarak bunu manuel olarak kontrol edebiliriz:
- Ortalama asist: (33 + 28 + 31) / 3 = 30,66667
Ek kaynaklar
Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:
Pandalar’daki sütunların ortalaması nasıl hesaplanır?
Pandalarda Hareketli Ortalama Nasıl Hesaplanır?
Pandalarda NaN değerleri ortalamayla nasıl doldurulur?