Pandas: hitung mean & std kolom di groupby


Anda dapat menggunakan sintaks berikut untuk menghitung mean dan deviasi standar kolom setelah menggunakan operasi groupby() di pandas:

 df. groupby ([' team '], as_index= False ). agg ({' points ':[' mean ', ' std ']})

Contoh khusus ini mengelompokkan baris DataFrame pandas berdasarkan nilai di kolom Tim , lalu menghitung mean dan deviasi standar dari nilai di kolom Poin .

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: Hitung mean dan norma kolom di Pandas groupby

Misalkan kita memiliki panda DataFrame berikut yang berisi informasi tentang pemain bola basket dari tim yang berbeda:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
                   ' points ': [12, 15, 17, 17, 19, 14, 15, 20, 24, 28],
                   ' assists ': [5, 5, 7, 9, 10, 14, 13, 8, 2, 7]})
                            
#view DataFrame
print (df)

  team points assists
0 to 12 5
1 to 15 5
2 To 17 7
3 To 17 9
4 B 19 10
5 B 14 14
6 B 15 13
7 C 20 8
8 C 24 2
9 C 28 7

Kita dapat menggunakan sintaks berikut untuk menghitung mean dan deviasi standar dari nilai-nilai pada kolom poin , yang dikelompokkan berdasarkan kolom tim :

 #calculate mean and standard deviation of points, grouped by team
output = df. groupby ([' team '], as_index= False ). agg ({' points ':[' mean ', ' std ']})

#view results
print (output)

  team points          
         mean std
0 A 15.25 2.362908
1 B 16.00 2.645751
2 C 24.00 4.000000

Dari hasilnya kita dapat melihat:

  • Nilai rata-rata poin tim A adalah 15,25 .
  • Standar deviasi poin Tim A adalah 2.362908 .

Dan seterusnya.

Kita juga bisa mengganti nama kolomnya agar hasilnya lebih mudah dibaca:

 #rename columns
output.output. columns = [' team ', ' points_mean ', ' points_std ']

#view updated results
print (output)

  team points_mean points_std
0 A 15.25 2.362908
1 B 16.00 2.645751
2 C 24.00 4.000000

Catatan : Anda dapat menemukan dokumentasi lengkap operasi pandas groupby() di sini .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di panda:

Cara melakukan penjumlahan GroupBy di Pandas
Cara menggunakan Groupby dan Plot di Pandas
Cara menghitung nilai unik menggunakan GroupBy di Pandas

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *