Як обчислити середнє значення стовпців у pandas


Часто вам може бути цікаво обчислити середнє значення одного або кількох стовпців у pandas DataFrame. На щастя, ви можете легко зробити це в pandas за допомогою функції Mean() .

Цей підручник показує кілька прикладів використання цієї функції.

Приклад 1: Знайдіть середнє значення одного стовпця

Припустімо, що у нас є наступні pandas DataFrame:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J '],
                   'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
                   'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#view DataFrame 
df

        player points assists rebounds
0 A 25 5 NaN
1 B 20 7 8.0
2 C 14 7 10.0
3 D 16 8 6.0
4 E 27 5 6.0
5 F 20 7 9.0
6 G 12 6 6.0
7:15 9 10.0
8 I 14 9 10.0
9 D 19 5 7.0

Ми можемо знайти середнє значення стовпця з позначкою «бали», використовуючи такий синтаксис:

 df['points']. mean ()

18.2

Функція Mean() також виключає NA за замовчуванням. Наприклад, якщо ми знайдемо середнє значення стовпця «підбирання», перше значення «NaN» буде просто виключено з розрахунку:

 df['rebounds']. mean ()

8.0

Якщо ви спробуєте знайти середнє значення стовпця, який не є числовим, ви отримаєте повідомлення про помилку:

 df['player']. mean ()

TypeError: Could not convert ABCDEFGHIJ to numeric

Приклад 2: Знайдіть середнє значення кількох стовпців

Ми можемо знайти середнє значення кількох стовпців за допомогою такого синтаксису:

 #find mean of points and rebounds columns
df[['rebounds', 'points']]. mean ()

rebounds 8.0
points 18.2
dtype:float64

Приклад 3: Знайдіть середнє значення всіх стовпців

Ми також можемо знайти середнє значення всіх числових стовпців за допомогою такого синтаксису:

 #find mean of all numeric columns in DataFrame
df. mean ()

points 18.2
assists 6.8
rebounds 8.0
dtype:float64

Зауважте, що функція Mean() просто ігноруватиме стовпці, які не є числовими.

Додаткові ресурси

Як розрахувати медіану в пандах
Як обчислити суму стовпців у Pandas
Як знайти максимальне значення стовпців у Pandas

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *