Як обчислити середнє, медіану та моду в пандах
Ви можете використовувати такі функції, щоб обчислити середнє значення, медіану та моду кожного числового стовпця в pandas DataFrame:
print ( df.mean (numeric_only= True )) print (df. median (numeric_only= True )) print (df. mode (numeric_only= True ))
У наступному прикладі показано, як використовувати ці функції на практиці.
Приклад: обчисліть середнє значення, медіану та моду в Pandas
Припустімо, що ми маємо такий фрейм даних pandas, який містить інформацію про очки, набрані різними баскетболістами в чотирьох різних іграх:
import pandas as pd #createDataFrame df = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' game1 ': [18, 22, 19, 14, 14, 11, 20, 28], ' game2 ': [5, 7, 7, 9, 12, 9, 9, 4], ' game3 ': [11, 8, 10, 6, 6, 5, 9, 12], ' game4 ': [9, 8, 10, 9, 14, 15, 10, 11]}) #view DataFrame print (df) player game1 game2 game3 game4 0 A 18 5 11 9 1 B 22 7 8 8 2 C 19 7 10 10 3 D 14 9 6 9 4 E 14 12 6 14 5 F 11 9 5 15 6 G 20 9 9 10 7:28 4 12 11
Ми можемо використати такий синтаксис, щоб обчислити середнє значення кожного числового стовпця:
#calculate mean of each numeric column print ( df.mean (numeric_only= True )) game1 18,250 game2 7,750 game3 8.375 game4 10,750 dtype:float64
З результату ми бачимо:
- Середнє значення в стовпці game1 становить 18,25 .
- Середнє значення в стовпці game2 становить 7,75 .
- Середнє значення в стовпці game3 становить 8,375 .
- Середнє значення в стовпці game4 становить 10,75 .
Потім ми можемо використати такий синтаксис для обчислення медіанного значення кожного числового стовпця:
#calculate median of each numeric column print (df. median (numeric_only= True )) game1 18.5 game2 8.0 game3 8.5 game4 10.0 dtype:float64
З результату ми бачимо:
- Середнє значення в стовпці game1 становить 18,5 .
- Середнє значення в стовпці game2 дорівнює 8 .
- Середнє значення в стовпці game3 становить 8,5 .
- Середнє значення в стовпці game4 дорівнює 10 .
Потім ми можемо використовувати наступний синтаксис для обчислення режиму кожного числового стовпця:
#calculate mode of each numeric column print (df. mode (numeric_only= True )) game1 game2 game3 game4 0 14.0 9.0 6.0 9 1 NaN NaN NaN 10
З результату ми бачимо:
- Режим у колонці game1 — 14 .
- Режим у колонці game2 — 9 .
- Режим у колонці game3 дорівнює 6 .
- Режим у колонці game4 — це 9 і 10
Зверніть увагу, що стовпець game4 мав два режими, оскільки в цьому стовпці було два значення, які найчастіше з’являлися.
Примітка : ви також можете використовувати функцію describe() у pandas, щоб створити більш детальну статистику для кожного стовпця.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові операції в pandas:
Як розрахувати середнє групове значення панд
Як розрахувати медіану групи у панд
Як розрахувати режим за групою в Pandas