Pandas'ta birden çok sütunda benzersiz değerler nasıl bulunur?


Genellikle bir pandas DataFrame’de birden fazla sütundaki tüm benzersiz değerleri bulmak isteyebilirsiniz. Neyse ki, pandas Unique() işlevini ravel() işleviyle birleştirerek bunu yapmak kolaydır:

  • benzersiz() : görünüm sırasına göre benzersiz değerler döndürür.
  • ravel(): bir dizi düzleştirilmiş veri döndürür.

Örneğin, aşağıdaki pandalara sahip olduğumuzu varsayalım DataFrame:

 import pandas as pd

#createDataFrame
df = pd.DataFrame({'col1': ['a', 'b', 'c', 'd', 'e'],
                   'col2': ['a', 'c', 'e', 'f', 'g'],
                   'col3': [11, 8, 10, 6, 6]})

#view DataFrame 
print(df)

  col1 col2 col3
0 aa 11
1 bc 8
2 this 10
3 df 6
4 eg 6

Benzersiz değerlerin bir dizisini döndürür

Aşağıdaki kod col1 ve col2’de benzersiz değerlerin nasıl bulunacağını gösterir:

 p.d. unique (df[[' col1 ', ' col2 ']]. values . ravel ())

array(['a', 'b', 'c', 'e', 'd', 'f', 'g'], dtype=object)

Sonuçtan bu iki sütunda 7 benzersiz değerin olduğunu görebiliriz: a, b, c, d, e, f, g .

Benzersiz değerlerin DataFrame’ini döndür

Bu değerleri dizi yerine DataFrame olarak döndürmek istiyorsanız aşağıdaki kodu kullanabilirsiniz:

 unique = pd. unique (df[[' col1 ', ' col2 ']]. values . ravel ())

p.d. DataFrame (unique)

	0
0 a
1b
2 tbsp
3rd
4 d
5f
6g

Benzersiz değerlerin sayısını döndürür

Birden fazla sütundaki benzersiz değerlerin sayısını bilmek istiyorsanız aşağıdaki kodu kullanabilirsiniz:

 unique = pd. unique (df[[' col1 ', ' col2 ']]. values . ravel ())

len (unique)
7

Bu bize bu iki sütunda 7 benzersiz değerin olduğunu anlatır.

Ek kaynaklar

Pandas DataFrames’ı birden çok sütunda birleştirme
Pandas DataFrame’i birden çok koşulda filtreleme

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir