Hoe unieke waarden in panda's te tellen: met voorbeelden


U kunt de functie nunique() gebruiken om het aantal unieke waarden in een pandas DataFrame te tellen.

Deze functie gebruikt de volgende basissyntaxis:

 #count unique values in each column
df. nunique ()

#count unique values in each row
df. nunique (axis= 1 )

De volgende voorbeelden laten zien hoe u deze functie in de praktijk kunt gebruiken met de volgende panda’s DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [8, 8, 13, 13, 22, 22, 25, 29],
                   ' assists ': [5, 8, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 11, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team points assists rebounds
0 to 8 5 11
1 To 8 8 8
2 to 13 7 11
3 A 13 9 6
4 B 22 12 6
5 B 22 9 5
6 B 25 9 9
7 B 29 4 12

Voorbeeld 1: Tel unieke waarden in elke kolom

De volgende code laat zien hoe u het aantal unieke waarden in elke kolom van een DataFrame kunt tellen:

 #count unique values in each column
df. nunique ()

team 2
points 5
assists 5
rebounds 6
dtype: int64

Uit het resultaat kunnen we zien:

  • De kolom “team” heeft 2 unieke waarden
  • De kolom “punten” heeft 5 unieke waarden
  • De kolom ‘assistentie’ heeft 5 unieke waarden
  • De kolom ‚rebounds‘ heeft 6 unieke waarden

Voorbeeld 2: Tel unieke waarden in elke rij

De volgende code laat zien hoe u het aantal unieke waarden in elke rij van een DataFrame kunt tellen:

 #count unique values in each row
df. nunique (axis= 1 )

0 4
1 2
2 4
3 4
4 4
5 4
6 3
7 4
dtype: int64

Uit het resultaat kunnen we zien:

  • De eerste regel heeft 4 unieke waarden
  • De tweede regel heeft 2 unieke waarden
  • De derde rij heeft 4 unieke waarden

Enzovoort.

Voorbeeld 3: Tel unieke waarden per groep

De volgende code laat zien hoe je het aantal unieke waarden per groep in een DataFrame telt:

 #count unique 'points' values, grouped by team
df. groupby (' team ')[' points ']. nunique ()

team
At 2
B 3
Name: points, dtype: int64

Uit het resultaat kunnen we zien:

  • Team “A” heeft 2 unieke “punt”-waarden
  • Team “B” heeft 3 unieke “punt”-waarden

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Hoe groepswaarnemingen bij panda’s te tellen
Hoe ontbrekende waarden bij panda’s te tellen
Hoe de functie value_counts() van Panda’s te gebruiken

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert