Cara menggunakan fungsi pandas value_counts() (dengan contoh)
Anda dapat menggunakan fungsi value_counts() untuk menghitung frekuensi nilai unik dalam rangkaian pandas.
Fungsi ini menggunakan sintaks dasar berikut:
my_series. value_counts ()
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh 1: Hitung frekuensi nilai unik
Kode berikut menunjukkan cara menghitung kemunculan nilai unik dalam rangkaian pandas:
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts () 3 4 4 2 7 2 8 1 9 1 dtype: int64
Ini memberitahu kita:
- Nilai 3 muncul 4 kali.
- Nilai 4 muncul dua kali .
- Nilai 7 muncul dua kali .
Dan seterusnya.
Contoh 2: Hitung frekuensi nilai unik (termasuk NaN)
Secara default, fungsi value_counts() tidak menampilkan frekuensi nilai NaN.
Namun, Anda dapat menggunakan argumen dropna untuk menampilkan frekuensi nilai NaN:
import pandas as pd import numpy as np #create pandas Series with some NaN values my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9, np.nan, np.nan]) #count occurrences of unique values in Series, including NaNs my_series. value_counts (dropna= False ) 3.0 4 4.0 2 7.0 2 NaN2 8.0 1 9.0 1 dtype: int64
Contoh 3: Hitung frekuensi relatif dari nilai unik
Kode berikut menunjukkan cara menggunakan argumen normalisasi untuk menghitung frekuensi relatif nilai unik dalam rangkaian pandas:
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts (normalize= True ) 3 0.4 4 0.2 7 0.2 8 0.1 9 0.1 dtype:float64
Ini memberitahu kita:
- Nilai 3 mewakili 40% dari seluruh nilai dalam rangkaian tersebut.
- Nilai 4 mewakili 20% dari seluruh nilai dalam rangkaian tersebut.
- Nilai 7 mewakili 20% dari seluruh nilai dalam rangkaian tersebut.
Dan seterusnya.
Contoh 4: Menghitung frekuensi dalam bin
Kode berikut menunjukkan cara menggunakan argumen bins untuk menghitung frekuensi nilai dalam rangkaian pandas yang termasuk dalam bins dengan ukuran yang sama:
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts (bins= 3 ) (3.0, 5.0] 6 (5.0, 7.0] 2 (7.0, 9.0] 2 dtype: int64
Ini memberitahu kita:
- Ada 6 nilai antara 3 dan 5.
- Ada 2 nilai antara 5 dan 7.
- Ada 2 nilai antara 7 dan 9.
Contoh 5: Hitung frekuensi nilai di Pandas DataFrame
Kita juga dapat menggunakan fungsi value_counts() untuk menghitung frekuensi nilai unik di kolom tertentu dari pandas DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' points ': [9, 9, 9, 10, 10, 13, 15, 22], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #count occurrences of unique values in 'points' column df[' points ']. value_counts () 9 3 10 2 13 1 15 1 22 1 Name: points, dtype: int64
Sumber daya tambahan
Tutorial berikut menjelaskan cara menggunakan fungsi umum lainnya di panda:
Cara menggunakan fungsi deskripsikan() di Pandas
Cara menghitung jumlah baris di Pandas
Cara menghitung penampakan kelompok pada panda