Jak obliczyć średnią warunkową w pandach (z przykładami)


Aby obliczyć średnią warunkową w pandach, możesz użyć następującej składni:

 df. loc [df[' team '] == ' A ', ' points ']. mean ()

Spowoduje to obliczenie średniej z kolumny „punkty” dla każdego wiersza w ramce DataFrame, gdzie kolumna „zespół” jest równa „A”.

Poniższe przykłady pokazują, jak w praktyce używać tej składni z następującą ramką DataFrame pand:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B'],
                   ' points ': [99, 90, 93, 86, 88, 82],
                   ' assists ': [33, 28, 31, 39, 34, 30]})

#view DataFrame
print (df)

  team points assists
0 to 99 33
1 A 90 28
2 A 93 31
3 B 86 39
4 B 88 34
5 B 82 30

Przykład 1: Oblicz średnią warunkową dla zmiennej kategorycznej

Poniższy kod pokazuje, jak obliczyć średnią z kolumny „punkty” tylko dla wierszy w ramce DataFrame, gdzie kolumna „zespół” ma wartość „A”.

 #calculate mean of 'points' column for rows where team equals 'A'
df. loc [df[' team '] == ' A ', ' points ']. mean ()

94.0

Średnia wartość w kolumnie „punkty” dla wierszy, w których „zespół” równa się „A” wynosi 94 .

Możemy to sprawdzić ręcznie, uśredniając wartości punktowe tylko dla linii, w których „zespół” równa się „A”:

  • Średnia punktów: (99 + 90 + 93) / 3 = 94

Przykład 2: Oblicz średnią warunkową dla zmiennej numerycznej

Poniższy kod pokazuje, jak obliczyć średnią kolumnę „pomocy” tylko dla wierszy w ramce DataFrame, gdzie kolumna „punkty” ma wartość większą lub równą 90.

 #calculate mean of 'assists' column for rows where 'points' >= 90
df. loc [df[' points '] >= 90 , ' assists ']. mean ()

30.666666666666668

Średnia wartość w kolumnie „asysty” dla wierszy, w których „punkty” są większe lub równe 90, wynosi 30,66667 .

Możemy to sprawdzić ręcznie, uśredniając wartości punktowe tylko dla linii, w których „zespół” równa się „A”:

  • Średnia asyst: (33 + 28 + 31) / 3 = 30,66667

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Jak obliczyć średnią kolumn w Pandach
Jak obliczyć średnią ruchomą w pandach
Jak wypełnić wartości NaN średnią w pandach

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *