Pandas'ta birden çok sütunda benzersiz değerler nasıl bulunur?
Genellikle bir pandas DataFrame’de birden fazla sütundaki tüm benzersiz değerleri bulmak isteyebilirsiniz. Neyse ki, pandas Unique() işlevini ravel() işleviyle birleştirerek bunu yapmak kolaydır:
- benzersiz() : görünüm sırasına göre benzersiz değerler döndürür.
- ravel(): bir dizi düzleştirilmiş veri döndürür.
Örneğin, aşağıdaki pandalara sahip olduğumuzu varsayalım DataFrame:
import pandas as pd #createDataFrame df = pd.DataFrame({'col1': ['a', 'b', 'c', 'd', 'e'], 'col2': ['a', 'c', 'e', 'f', 'g'], 'col3': [11, 8, 10, 6, 6]}) #view DataFrame print(df) col1 col2 col3 0 aa 11 1 bc 8 2 this 10 3 df 6 4 eg 6
Benzersiz değerlerin bir dizisini döndürür
Aşağıdaki kod col1 ve col2’de benzersiz değerlerin nasıl bulunacağını gösterir:
p.d. unique (df[[' col1 ', ' col2 ']]. values . ravel ()) array(['a', 'b', 'c', 'e', 'd', 'f', 'g'], dtype=object)
Sonuçtan bu iki sütunda 7 benzersiz değerin olduğunu görebiliriz: a, b, c, d, e, f, g .
Benzersiz değerlerin DataFrame’ini döndür
Bu değerleri dizi yerine DataFrame olarak döndürmek istiyorsanız aşağıdaki kodu kullanabilirsiniz:
unique = pd. unique (df[[' col1 ', ' col2 ']]. values . ravel ()) p.d. DataFrame (unique) 0 0 a 1b 2 tbsp 3rd 4 d 5f 6g
Benzersiz değerlerin sayısını döndürür
Birden fazla sütundaki benzersiz değerlerin sayısını bilmek istiyorsanız aşağıdaki kodu kullanabilirsiniz:
unique = pd. unique (df[[' col1 ', ' col2 ']]. values . ravel ()) len (unique) 7
Bu bize bu iki sütunda 7 benzersiz değerin olduğunu anlatır.
Ek kaynaklar
Pandas DataFrames’ı birden çok sütunda birleştirme
Pandas DataFrame’i birden çok koşulda filtreleme