Ontbrekende waarden in r vinden en tellen (met voorbeelden)


U kunt de volgende methoden gebruiken om ontbrekende waarden in R te vinden en te tellen:

Methode 1: Zoek de locatie van ontbrekende waarden

 which( is.na (df$column_name))

Methode 2: Tel de totale ontbrekende waarden

 sum( is.na (df$column_name))

De volgende voorbeelden laten zien hoe u deze functies in de praktijk kunt gebruiken.

Voorbeeld 1: Zoek en tel ontbrekende waarden in een kolom

Stel dat we het volgende dataframe hebben:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#view data frame
df

  team points assists rebounds
1 A 99 NA 30
2 B 90 28 28
3 C 86 NA 24
4 NA 88 NA 24
5 E 95 34 NA

We kunnen de volgende code gebruiken om posities met ontbrekende waarden in de kolom ‚assist‘ te identificeren en de totale ontbrekende waarden in de kolom ‚assist‘ te vinden:

 #identify locations of missing values in 'assists' column
which( is.na (df$assists))

[1] 1 3 4

#count total missing values in 'assists' column
sum( is.na (df$assists))

[1] 3 

Uit het resultaat kunnen we zien dat posities 1 , 3 en 4 ontbrekende waarden hebben in de kolom ‚assisten‘ en dat er in totaal 3 ontbrekende waarden in de kolom staan.

Voorbeeld 2: Tel ontbrekende waarden in alle kolommen

De volgende code laat zien hoe u de totale ontbrekende waarden in elke kolom van een dataframe kunt tellen:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in each column of data frame
sapply(df, function (x) sum(is. na (x)))

    team points assists rebounds 
       1 0 3 1

Uit het resultaat kunnen we zien:

  • De kolom “team” bevat 1 ontbrekende waarde.
  • De kolom “punten” bevat 0 ontbrekende waarden.
  • De kolom ‘assistentie’ bevat 3 ontbrekende waarden.
  • De kolom ‘rebounds’ bevat 1 ontbrekende waarde.

Voorbeeld 3: Tel ontbrekende waarden in het gehele dataframe

De volgende code laat zien hoe u de totale ontbrekende waarden in een volledig dataframe kunt tellen:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in entire data frame
sum( is.na (df))

[1] 5

Uit het resultaat kunnen we zien dat er in totaal 5 ontbrekende waarden zijn in het gehele dataframe.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen met ontbrekende waarden in R kunt uitvoeren:

Hoe je allemaal ontbrekende waarden in R kunt toeschrijven
NA’s vervangen door strings in R
Hoe NA te vervangen door Zero in dplyr

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert