Cara menggunakan fungsi pandas value_counts() (dengan contoh)


Anda dapat menggunakan fungsi value_counts() untuk menghitung frekuensi nilai unik dalam rangkaian pandas.

Fungsi ini menggunakan sintaks dasar berikut:

 my_series. value_counts ()

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh 1: Hitung frekuensi nilai unik

Kode berikut menunjukkan cara menghitung kemunculan nilai unik dalam rangkaian pandas:

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts ()

3 4
4 2
7 2
8 1
9 1
dtype: int64

Ini memberitahu kita:

  • Nilai 3 muncul 4 kali.
  • Nilai 4 muncul dua kali .
  • Nilai 7 muncul dua kali .

Dan seterusnya.

Contoh 2: Hitung frekuensi nilai unik (termasuk NaN)

Secara default, fungsi value_counts() tidak menampilkan frekuensi nilai NaN.

Namun, Anda dapat menggunakan argumen dropna untuk menampilkan frekuensi nilai NaN:

 import pandas as pd
import numpy as np

#create pandas Series with some NaN values
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9, np.nan, np.nan])

#count occurrences of unique values in Series, including NaNs
my_series. value_counts (dropna= False )

3.0 4
4.0 2
7.0 2
NaN2
8.0 1
9.0 1
dtype: int64

Contoh 3: Hitung frekuensi relatif dari nilai unik

Kode berikut menunjukkan cara menggunakan argumen normalisasi untuk menghitung frekuensi relatif nilai unik dalam rangkaian pandas:

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts (normalize= True )

3 0.4
4 0.2
7 0.2
8 0.1
9 0.1
dtype:float64

Ini memberitahu kita:

  • Nilai 3 mewakili 40% dari seluruh nilai dalam rangkaian tersebut.
  • Nilai 4 mewakili 20% dari seluruh nilai dalam rangkaian tersebut.
  • Nilai 7 mewakili 20% dari seluruh nilai dalam rangkaian tersebut.

Dan seterusnya.

Contoh 4: Menghitung frekuensi dalam bin

Kode berikut menunjukkan cara menggunakan argumen bins untuk menghitung frekuensi nilai dalam rangkaian pandas yang termasuk dalam bins dengan ukuran yang sama:

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts (bins= 3 )

(3.0, 5.0] 6
(5.0, 7.0] 2
(7.0, 9.0] 2
dtype: int64

Ini memberitahu kita:

  • Ada 6 nilai antara 3 dan 5.
  • Ada 2 nilai antara 5 dan 7.
  • Ada 2 nilai antara 7 dan 9.

Contoh 5: Hitung frekuensi nilai di Pandas DataFrame

Kita juga dapat menggunakan fungsi value_counts() untuk menghitung frekuensi nilai unik di kolom tertentu dari pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [9, 9, 9, 10, 10, 13, 15, 22],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#count occurrences of unique values in 'points' column
df[' points ']. value_counts ()

9 3
10 2
13 1
15 1
22 1
Name: points, dtype: int64

Sumber daya tambahan

Tutorial berikut menjelaskan cara menggunakan fungsi umum lainnya di panda:

Cara menggunakan fungsi deskripsikan() di Pandas
Cara menghitung jumlah baris di Pandas
Cara menghitung penampakan kelompok pada panda

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *