Panda'nın value_counts() işlevi nasıl kullanılır (örneklerle)


Bir panda serisindeki benzersiz değerlerin sıklığını saymak için value_counts() işlevini kullanabilirsiniz.

Bu işlev aşağıdaki temel sözdizimini kullanır:

 my_series. value_counts ()

Aşağıdaki örnekler bu sözdiziminin pratikte nasıl kullanılacağını göstermektedir.

Örnek 1: Benzersiz değerlerin sıklığını sayın

Aşağıdaki kod, bir panda serisindeki benzersiz değerlerin oluşumlarının nasıl sayılacağını gösterir:

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts ()

3 4
4 2
7 2
8 1
9 1
dtype: int64

Bu bize şunları söylüyor:

  • 3 değeri 4 kez görünür.
  • 4 değeri iki kez görünür.
  • 7 değeri iki kez görünür.

Ve benzeri.

Örnek 2: Benzersiz değerlerin sıklığını sayın (NaN dahil)

Varsayılan olarak value_counts() işlevi NaN değerlerinin sıklığını görüntülemez.

Ancak NaN değerlerinin sıklığını görüntülemek için dropna argümanını kullanabilirsiniz:

 import pandas as pd
import numpy as np

#create pandas Series with some NaN values
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9, np.nan, np.nan])

#count occurrences of unique values in Series, including NaNs
my_series. value_counts (dropna= False )

3.0 4
4.0 2
7.0 2
NaN2
8.0 1
9.0 1
dtype: int64

Örnek 3: Benzersiz değerlerin göreli sıklığını sayın

Aşağıdaki kod, bir panda serisindeki benzersiz değerlerin göreli sıklığını saymak için normalleştirme bağımsız değişkeninin nasıl kullanılacağını gösterir:

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts (normalize= True )

3 0.4
4 0.2
7 0.2
8 0.1
9 0.1
dtype:float64

Bu bize şunları söylüyor:

  • 3 değeri serideki tüm değerlerin %40’ını temsil eder.
  • 4 değeri serideki tüm değerlerin %20’sini temsil eder.
  • 7 değeri serideki tüm değerlerin %20’sini temsil eder.

Ve benzeri.

Örnek 4: Kutulardaki sıklığı sayma

Aşağıdaki kod, bir panda serisindeki eşit büyüklükteki bölmelere düşen değerlerin sıklığını saymak için bins bağımsız değişkeninin nasıl kullanılacağını gösterir:

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts (bins= 3 )

(3.0, 5.0] 6
(5.0, 7.0] 2
(7.0, 9.0] 2
dtype: int64

Bu bize şunları söylüyor:

  • 3 ile 5 arasında 6 değer bulunmaktadır.
  • 5 ile 7 arasında 2 değer bulunmaktadır.
  • 7 ile 9 arasında 2 değer bulunmaktadır.

Örnek 5: Pandas DataFrame’deki değerlerin sıklığını sayın

Bir pandanın DataFrame’inin belirli bir sütunundaki benzersiz değerlerin sıklığını hesaplamak için value_counts() işlevini de kullanabiliriz:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [9, 9, 9, 10, 10, 13, 15, 22],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#count occurrences of unique values in 'points' column
df[' points ']. value_counts ()

9 3
10 2
13 1
15 1
22 1
Name: points, dtype: int64

Ek kaynaklar

Aşağıdaki eğitimler pandalarda diğer ortak işlevlerin nasıl kullanılacağını açıklamaktadır:

Pandalarda define() işlevi nasıl kullanılır?
Pandalar’daki satır sayısı nasıl sayılır?
Pandalarda grup görülmeleri nasıl sayılır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir