Hoe de nchar()-functie in r te gebruiken


De functie nchar() in R kan worden gebruikt om de lengte van tekens in een stringobject te tellen.

Deze functie gebruikt de volgende basissyntaxis:

nchar(x, keepNA = NA)

Goud:

  • x : Naam van het stringobject
  • keepNA : De standaardwaarde is om ‚NA‘ te retourneren als NA wordt aangetroffen. Indien ingesteld op TRUE, wordt een waarde van 2 geretourneerd om de lengte van „NA“ als een tekenreeks weer te geven.

De volgende voorbeelden laten zien hoe u deze functie in de praktijk kunt gebruiken.

Voorbeeld 1: Gebruik nchar() om de tekenlengte te tellen

Stel dat we het volgende dataframe in R hebben:

 #create data frame
df <- data. frame (player=c('J Kidd', 'Kobe Bryant', 'Paul A. Pierce', 'Steve Nash'),
                 dots=c(22, 34, 30, 17))

#view data frame
df

          player points
1 J Kidd 22
2 Kobe Bryant 34
3 Paul A. Pierce 30
4Steve Nash 17

De volgende code laat zien hoe u de functie nchar() gebruikt om de lengte van elke tekenreeks in de lezerkolom te tellen:

 #create new column that counts length of characters in player column
df$player_length <- nchar(df$player)

#view updated data frame
df

player points player_length
1 J Kidd 22 6
2 Kobe Bryant 34 11
3 Paul A. Pierce 30 14
4 Steve Nash 17 10

De nieuwe kolom genaamd player_length bevat de lengte van elke string in de player- kolom.

Merk op dat de functie nchar() ook spaties en speciale tekens telt.

In de naam „Paul A. Pierce“ telt de functie nchar() bijvoorbeeld zowel spaties als de punt plus alle letters om een totale lengte van 14 te krijgen.

Voorbeeld 2: Gebruik nchar() met NA-waarden

Stel dat we het volgende dataframe in R hebben:

 #create data frame
df <- data. frame (player=c(NA, 'Kobe Bryant', 'Paul A. Pierce', 'Steve Nash'),
                 dots=c(22, 34, 30, 17))

#view data frame
df

          player points
1 <NA> 22
2 Kobe Bryant 34
3 Paul A. Pierce 30
4Steve Nash 17

Als we de functie nchar() gebruiken om de lengte van elke tekenreeks in de lezerkolom te tellen, wordt voor de eerste rij standaard de waarde NA geretourneerd:

 #create new column that counts length of characters in player column
df$player_length <- nchar(df$player)

#view updated data frame
df

player points player_length
1 <NA> 22 NA
2 Kobe Bryant 34 11
3 Paul A. Pierce 30 14
4 Steve Nash 17 10

Als we echter het argument keepNA=FALSE gebruiken, wordt een waarde van 2 geretourneerd voor elke tekenreeks die gelijk is aan NA:

 #create new column that counts length of characters in player column
df$player_length <- nchar(df$player, keepNA= FALSE )

#view updated data frame
df

          player points player_length
1 <NA> 22 2
2 Kobe Bryant 34 11
3 Paul A. Pierce 30 14
4 Steve Nash 17 10

Merk op dat een waarde van 2 wordt geretourneerd voor de startspeler, aangezien dit de lengte van „NA“ als een string vertegenwoordigt.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:

Hoe het laatste teken uit de string in R te verwijderen
Hoe de substring-functie te gebruiken in R
Hoe de str_pad-functie in R te gebruiken

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert