Pandas: cara mengurutkan hasil value_counts()
Anda dapat menggunakan fungsi value_counts() di panda untuk menghitung kemunculan nilai di kolom DataFrame tertentu.
Anda dapat menggunakan salah satu metode berikut untuk mengurutkan hasil fungsi value_counts() :
Metode 1: Urutkan akun dalam urutan menurun (default)
df. my_column . value_counts ()
Metode 2: Urutkan akun dalam urutan menaik
df. my_column . value_counts (). sort_values ()
Metode 3: Urutkan jumlah sesuai urutan kemunculannya di DataFrame
df. my_column . value_counts ()[df. my_column . single ()]
Contoh berikut menunjukkan cara menggunakan setiap metode dalam praktik dengan pandas DataFrame berikut:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'B', 'C'], ' points ': [15, 12, 18, 20, 22, 28, 35, 40]}) #view DataFrame print (df) team points 0 to 15 1 to 12 2 B 18 3 B 20 4 B 22 5 B 28 6 B 35 7 C 40
Contoh 1: Urutkan akun dalam urutan menurun
Kode berikut memperlihatkan cara menghitung kemunculan setiap nilai unik di kolom tim dan mengurutkan angka dalam urutan menurun:
#count occurrences of each value in team column and sort in descending order df. team . value_counts () B5 At 2 C 1 Name: team, dtype: int64
Perhatikan bahwa penghitungan diurutkan dalam urutan menurun secara default.
Contoh 2: Urutkan akun dalam urutan menaik
Kode berikut memperlihatkan cara menghitung kemunculan setiap nilai unik di kolom tim dan mengurutkan angka dalam urutan menaik:
#count occurrences of each value in team column and sort in ascending order df. team . value_counts (). sort_values () C 1 At 2 B5 Name: team, dtype: int64
Perhatikan bahwa akun sekarang diurutkan dalam urutan menaik, yaitu dari yang terkecil hingga yang terbesar.
Contoh 3: Urutkan akun sesuai urutan kemunculannya di DataFrame
Kode berikut menunjukkan cara menghitung kemunculan setiap nilai unik di kolom tim dan mengurutkan angka sesuai urutan kemunculan nilai unik di DataFrame:
#count occurrences of each value in team column and sort in order they appear df. team . value_counts ()[df. team . single ()] At 2 B5 C 1 Name: team, dtype: int64
Perhatikan bahwa penghitungan sekarang diurutkan berdasarkan urutan kemunculan nilai unik di DataFrame.
Misalnya nilai “A” muncul pertama kali di kolom tim, lalu muncul “B”, lalu “C”.
Jadi ini adalah urutan kemunculan hitungan di output.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:
Pandas: cara memplot akun nilai
Pandas: Cara menggunakan GroupBy dan penghitungan nilai
Pandas: cara merepresentasikan value_counts sebagai persentase