Cara menemukan jumlah baris di pandas dataframe
Seringkali Anda mungkin tertarik untuk menghitung jumlah satu atau lebih baris di pandas DataFrame. Untungnya, Anda dapat melakukannya dengan mudah di panda menggunakan fungsi sum(axis=1) .
Tutorial ini memperlihatkan beberapa contoh penggunaan fungsi ini pada DataFrame berikut:
import pandas as pd import numpy as np #createDataFrame df = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86], 'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19], 'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5], 'rebounds': [8, np.nan, 10, 6, 6, 9, 6, 10, 10, 7]}) #view DataFrame df rating points assists rebounds 0 90 25 5 8.0 1 85 20 7 NaN 2 82 14 7 10.0 3 88 16 8 6.0 4 94 27 5 6.0 5 90 20 7 9.0 6 76 12 6 6.0 7 75 15 9 10.0 8 87 14 9 10.0 9 86 19 5 7.07
Contoh 1: Temukan jumlah setiap baris
Kita dapat menemukan jumlah setiap baris DataFrame menggunakan sintaks berikut:
df. sum (axis=1)
0 128.0
1,112.0
2,113.0
3 118.0
4,132.0
5,126.0
6 100.0
7 109.0
8 120.0
9 117.0
dtype:float64
Outputnya memberitahu kita:
- Jumlah nilai pada baris pertama adalah 128 .
- Jumlah nilai pada baris kedua adalah 112 .
- Jumlah nilai pada baris ketiga adalah 113 .
Dan seterusnya.
Contoh 2: Tempatkan jumlah baris di kolom baru
Kita dapat menggunakan kode berikut untuk menambahkan kolom ke DataFrame untuk menampung jumlah baris:
#define new DataFrame column 'row_sum' as the sum of each row df['row_sum'] = df. sum (axis=1) #view DataFrame df rating points assists rebounds row_sum 0 90 25 5 8.0 128.0 1 85 20 7 NaN 112.0 2 82 14 7 10.0 113.0 3 88 16 8 6.0 118.0 4 94 27 5 6.0 132.0 5 90 20 7 9.0 126.0 6 76 12 6 6.0 100.0 7 75 15 9 10.0 109.0 8 87 14 9 10.0 120.0 9 86 19 5 7.0 117.0
Contoh 3: Temukan jumlah baris untuk daftar pendek kolom tertentu
Kita dapat menggunakan kode berikut untuk menemukan jumlah baris untuk daftar pendek kolom tertentu:
#define new DataFrame column as sum of points and assists columns df['sum_pa'] = df['points'] + df['assists'] #view DataFrame df rating points assists rebounds sum_pa 0 90 25 5 8.0 30 1 85 20 7 NaN 27 2 82 14 7 10.0 21 3 88 16 8 6.0 24 4 94 27 5 6.0 32 5 90 20 7 9.0 27 6 76 12 6 6.0 18 7 75 15 9 10.0 24 8 87 14 9 10.0 23 9 86 19 5 7.0 24
Contoh 4: Temukan jumlah baris untuk daftar panjang kolom tertentu
Kita dapat menggunakan kode berikut untuk menemukan jumlah baris untuk daftar kolom tertentu yang lebih panjang:
#define col_list as a list of all DataFrame column names col_list=list(df) #remove the column 'rating' from the list col_list.remove('rating') #define new DataFrame column as sum of rows in col_list df['new_sum'] = df[col_list]. sum (axis=1) #view DataFrame df rating points assists rebounds new_sum 0 90 25 5 8.0 38.0 1 85 20 7 NaN 27.0 2 82 14 7 10.0 31.0 3 88 16 8 6.0 30.0 4 94 27 5 6.0 38.0 5 90 20 7 9.0 36.0 6 76 12 6 6.0 24.0 7 75 15 9 10.0 34.0 8 87 14 9 10.0 33.0 9 86 19 5 7.0 31.0
Anda dapat menemukan dokumentasi lengkap fungsi pandas sum() di sini .