Pandalarda benzersiz değerler nasıl sayılır: örneklerle


Bir pandanın DataFrame’indeki benzersiz değerlerin sayısını saymak için nunique() işlevini kullanabilirsiniz.

Bu işlev aşağıdaki temel sözdizimini kullanır:

 #count unique values in each column
df. nunique ()

#count unique values in each row
df. nunique (axis= 1 )

Aşağıdaki örnekler, bu işlevin pratikte aşağıdaki pandalar DataFrame ile nasıl kullanılacağını gösterir:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [8, 8, 13, 13, 22, 22, 25, 29],
                   ' assists ': [5, 8, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 11, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team points assists rebounds
0 to 8 5 11
1 To 8 8 8
2 to 13 7 11
3 A 13 9 6
4 B 22 12 6
5 B 22 9 5
6 B 25 9 9
7 B 29 4 12

Örnek 1: Her sütundaki benzersiz değerleri sayın

Aşağıdaki kod, bir DataFrame’in her sütunundaki benzersiz değerlerin sayısının nasıl sayılacağını gösterir:

 #count unique values in each column
df. nunique ()

team 2
points 5
assists 5
rebounds 6
dtype: int64

Sonuçtan şunu görebiliriz:

  • “Ekip” sütununda 2 benzersiz değer bulunur
  • “Puan” sütununda 5 benzersiz değer bulunur
  • “Yardım” sütununda 5 benzersiz değer bulunur
  • ‘Geri tepme’ sütununun 6 benzersiz değeri vardır

Örnek 2: Her satırdaki benzersiz değerleri sayın

Aşağıdaki kod, bir DataFrame’in her satırındaki benzersiz değerlerin sayısının nasıl sayılacağını gösterir:

 #count unique values in each row
df. nunique (axis= 1 )

0 4
1 2
2 4
3 4
4 4
5 4
6 3
7 4
dtype: int64

Sonuçtan şunu görebiliriz:

  • İlk satırda 4 benzersiz değer var
  • İkinci satırda 2 benzersiz değer var
  • Üçüncü satırda 4 benzersiz değer var

Ve benzeri.

Örnek 3: Grup başına benzersiz değerleri sayın

Aşağıdaki kod, bir DataFrame’de grup başına benzersiz değerlerin sayısının nasıl sayılacağını gösterir:

 #count unique 'points' values, grouped by team
df. groupby (' team ')[' points ']. nunique ()

team
At 2
B 3
Name: points, dtype: int64

Sonuçtan şunu görebiliriz:

  • “A” Takımının 2 benzersiz “puan” değeri vardır
  • “B” Takımının 3 benzersiz “puan” değeri vardır

Ek kaynaklar

Aşağıdaki eğitimlerde pandalarda diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:

Pandalarda grup görülmeleri nasıl sayılır?
Pandalarda eksik değerler nasıl sayılır?
Panda’nın value_counts() işlevi nasıl kullanılır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir