Jak obliczyć średnią warunkową w pandach (z przykładami)
Aby obliczyć średnią warunkową w pandach, możesz użyć następującej składni:
df. loc [df[' team '] == ' A ', ' points ']. mean ()
Spowoduje to obliczenie średniej z kolumny „punkty” dla każdego wiersza w ramce DataFrame, gdzie kolumna „zespół” jest równa „A”.
Poniższe przykłady pokazują, jak w praktyce używać tej składni z następującą ramką DataFrame pand:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B'],
' points ': [99, 90, 93, 86, 88, 82],
' assists ': [33, 28, 31, 39, 34, 30]})
#view DataFrame
print (df)
team points assists
0 to 99 33
1 A 90 28
2 A 93 31
3 B 86 39
4 B 88 34
5 B 82 30
Przykład 1: Oblicz średnią warunkową dla zmiennej kategorycznej
Poniższy kod pokazuje, jak obliczyć średnią z kolumny „punkty” tylko dla wierszy w ramce DataFrame, gdzie kolumna „zespół” ma wartość „A”.
#calculate mean of 'points' column for rows where team equals 'A'
df. loc [df[' team '] == ' A ', ' points ']. mean ()
94.0
Średnia wartość w kolumnie „punkty” dla wierszy, w których „zespół” równa się „A” wynosi 94 .
Możemy to sprawdzić ręcznie, uśredniając wartości punktowe tylko dla linii, w których „zespół” równa się „A”:
- Średnia punktów: (99 + 90 + 93) / 3 = 94
Przykład 2: Oblicz średnią warunkową dla zmiennej numerycznej
Poniższy kod pokazuje, jak obliczyć średnią kolumnę „pomocy” tylko dla wierszy w ramce DataFrame, gdzie kolumna „punkty” ma wartość większą lub równą 90.
#calculate mean of 'assists' column for rows where 'points' >= 90
df. loc [df[' points '] >= 90 , ' assists ']. mean ()
30.666666666666668
Średnia wartość w kolumnie „asysty” dla wierszy, w których „punkty” są większe lub równe 90, wynosi 30,66667 .
Możemy to sprawdzić ręcznie, uśredniając wartości punktowe tylko dla linii, w których „zespół” równa się „A”:
- Średnia asyst: (33 + 28 + 31) / 3 = 30,66667
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:
Jak obliczyć średnią kolumn w Pandach
Jak obliczyć średnią ruchomą w pandach
Jak wypełnić wartości NaN średnią w pandach