Panda'nın value_counts() işlevi nasıl kullanılır (örneklerle)
Bir panda serisindeki benzersiz değerlerin sıklığını saymak için value_counts() işlevini kullanabilirsiniz.
Bu işlev aşağıdaki temel sözdizimini kullanır:
my_series. value_counts ()
Aşağıdaki örnekler bu sözdiziminin pratikte nasıl kullanılacağını göstermektedir.
Örnek 1: Benzersiz değerlerin sıklığını sayın
Aşağıdaki kod, bir panda serisindeki benzersiz değerlerin oluşumlarının nasıl sayılacağını gösterir:
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts () 3 4 4 2 7 2 8 1 9 1 dtype: int64
Bu bize şunları söylüyor:
- 3 değeri 4 kez görünür.
- 4 değeri iki kez görünür.
- 7 değeri iki kez görünür.
Ve benzeri.
Örnek 2: Benzersiz değerlerin sıklığını sayın (NaN dahil)
Varsayılan olarak value_counts() işlevi NaN değerlerinin sıklığını görüntülemez.
Ancak NaN değerlerinin sıklığını görüntülemek için dropna argümanını kullanabilirsiniz:
import pandas as pd import numpy as np #create pandas Series with some NaN values my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9, np.nan, np.nan]) #count occurrences of unique values in Series, including NaNs my_series. value_counts (dropna= False ) 3.0 4 4.0 2 7.0 2 NaN2 8.0 1 9.0 1 dtype: int64
Örnek 3: Benzersiz değerlerin göreli sıklığını sayın
Aşağıdaki kod, bir panda serisindeki benzersiz değerlerin göreli sıklığını saymak için normalleştirme bağımsız değişkeninin nasıl kullanılacağını gösterir:
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts (normalize= True ) 3 0.4 4 0.2 7 0.2 8 0.1 9 0.1 dtype:float64
Bu bize şunları söylüyor:
- 3 değeri serideki tüm değerlerin %40’ını temsil eder.
- 4 değeri serideki tüm değerlerin %20’sini temsil eder.
- 7 değeri serideki tüm değerlerin %20’sini temsil eder.
Ve benzeri.
Örnek 4: Kutulardaki sıklığı sayma
Aşağıdaki kod, bir panda serisindeki eşit büyüklükteki bölmelere düşen değerlerin sıklığını saymak için bins bağımsız değişkeninin nasıl kullanılacağını gösterir:
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts (bins= 3 ) (3.0, 5.0] 6 (5.0, 7.0] 2 (7.0, 9.0] 2 dtype: int64
Bu bize şunları söylüyor:
- 3 ile 5 arasında 6 değer bulunmaktadır.
- 5 ile 7 arasında 2 değer bulunmaktadır.
- 7 ile 9 arasında 2 değer bulunmaktadır.
Örnek 5: Pandas DataFrame’deki değerlerin sıklığını sayın
Bir pandanın DataFrame’inin belirli bir sütunundaki benzersiz değerlerin sıklığını hesaplamak için value_counts() işlevini de kullanabiliriz:
import pandas as pd #createDataFrame df = pd. DataFrame ({' points ': [9, 9, 9, 10, 10, 13, 15, 22], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #count occurrences of unique values in 'points' column df[' points ']. value_counts () 9 3 10 2 13 1 15 1 22 1 Name: points, dtype: int64
Ek kaynaklar
Aşağıdaki eğitimler pandalarda diğer ortak işlevlerin nasıl kullanılacağını açıklamaktadır:
Pandalarda define() işlevi nasıl kullanılır?
Pandalar’daki satır sayısı nasıl sayılır?
Pandalarda grup görülmeleri nasıl sayılır?