Cara menghitung rata-rata kolom di pandas
Seringkali Anda mungkin tertarik untuk menghitung rata-rata satu atau lebih kolom di pandas DataFrame. Untungnya, Anda dapat melakukan ini dengan mudah di panda menggunakan fungsi Mean() .
Tutorial ini menunjukkan beberapa contoh penggunaan fungsi ini.
Contoh 1: Temukan rata-rata satu kolom
Misalkan kita memiliki panda DataFrame berikut:
import pandas as pd import numpy as np #createDataFrame df = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J '], 'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19], 'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5], 'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]}) #view DataFrame df player points assists rebounds 0 A 25 5 NaN 1 B 20 7 8.0 2 C 14 7 10.0 3 D 16 8 6.0 4 E 27 5 6.0 5 F 20 7 9.0 6 G 12 6 6.0 7:15 9 10.0 8 I 14 9 10.0 9 D 19 5 7.0
Kita dapat mencari rata-rata kolom berlabel “poin” menggunakan sintaks berikut:
df['points']. mean ()
18.2
Fungsi Mean() juga akan mengecualikan NA secara default. Misalnya, jika kita menemukan rata-rata kolom “rebound”, nilai pertama “NaN” akan dikeluarkan dari penghitungan:
df['rebounds']. mean ()
8.0
Jika Anda mencoba mencari rata-rata kolom yang bukan numerik, Anda akan menerima pesan kesalahan:
df['player']. mean ()
TypeError: Could not convert ABCDEFGHIJ to numeric
Contoh 2: Temukan rata-rata beberapa kolom
Kita dapat menemukan rata-rata beberapa kolom menggunakan sintaks berikut:
#find mean of points and rebounds columns df[['rebounds', 'points']]. mean () rebounds 8.0 points 18.2 dtype:float64
Contoh 3: Temukan rata-rata semua kolom
Kita juga dapat mencari rata-rata semua kolom numerik menggunakan sintaks berikut:
#find mean of all numeric columns in DataFrame df. mean () points 18.2 assists 6.8 rebounds 8.0 dtype:float64
Perhatikan bahwa fungsi Mean() hanya akan mengabaikan kolom yang bukan numerik.
Sumber daya tambahan
Cara menghitung median di panda
Cara menghitung jumlah kolom di Pandas
Bagaimana menemukan nilai maksimum kolom di Pandas