Hoe de nchar()-functie in r te gebruiken
De functie nchar() in R kan worden gebruikt om de lengte van tekens in een stringobject te tellen.
Deze functie gebruikt de volgende basissyntaxis:
nchar(x, keepNA = NA)
Goud:
- x : Naam van het stringobject
- keepNA : De standaardwaarde is om ‚NA‘ te retourneren als NA wordt aangetroffen. Indien ingesteld op TRUE, wordt een waarde van 2 geretourneerd om de lengte van „NA“ als een tekenreeks weer te geven.
De volgende voorbeelden laten zien hoe u deze functie in de praktijk kunt gebruiken.
Voorbeeld 1: Gebruik nchar() om de tekenlengte te tellen
Stel dat we het volgende dataframe in R hebben:
#create data frame
df <- data. frame (player=c('J Kidd', 'Kobe Bryant', 'Paul A. Pierce', 'Steve Nash'),
dots=c(22, 34, 30, 17))
#view data frame
df
player points
1 J Kidd 22
2 Kobe Bryant 34
3 Paul A. Pierce 30
4Steve Nash 17
De volgende code laat zien hoe u de functie nchar() gebruikt om de lengte van elke tekenreeks in de lezerkolom te tellen:
#create new column that counts length of characters in player column
df$player_length <- nchar(df$player)
#view updated data frame
df
player points player_length
1 J Kidd 22 6
2 Kobe Bryant 34 11
3 Paul A. Pierce 30 14
4 Steve Nash 17 10
De nieuwe kolom genaamd player_length bevat de lengte van elke string in de player- kolom.
Merk op dat de functie nchar() ook spaties en speciale tekens telt.
In de naam „Paul A. Pierce“ telt de functie nchar() bijvoorbeeld zowel spaties als de punt plus alle letters om een totale lengte van 14 te krijgen.
Voorbeeld 2: Gebruik nchar() met NA-waarden
Stel dat we het volgende dataframe in R hebben:
#create data frame
df <- data. frame (player=c(NA, 'Kobe Bryant', 'Paul A. Pierce', 'Steve Nash'),
dots=c(22, 34, 30, 17))
#view data frame
df
player points
1 <NA> 22
2 Kobe Bryant 34
3 Paul A. Pierce 30
4Steve Nash 17
Als we de functie nchar() gebruiken om de lengte van elke tekenreeks in de lezerkolom te tellen, wordt voor de eerste rij standaard de waarde NA geretourneerd:
#create new column that counts length of characters in player column
df$player_length <- nchar(df$player)
#view updated data frame
df
player points player_length
1 <NA> 22 NA
2 Kobe Bryant 34 11
3 Paul A. Pierce 30 14
4 Steve Nash 17 10
Als we echter het argument keepNA=FALSE gebruiken, wordt een waarde van 2 geretourneerd voor elke tekenreeks die gelijk is aan NA:
#create new column that counts length of characters in player column
df$player_length <- nchar(df$player, keepNA= FALSE )
#view updated data frame
df
player points player_length
1 <NA> 22 2
2 Kobe Bryant 34 11
3 Paul A. Pierce 30 14
4 Steve Nash 17 10
Merk op dat een waarde van 2 wordt geretourneerd voor de startspeler, aangezien dit de lengte van „NA“ als een string vertegenwoordigt.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:
Hoe het laatste teken uit de string in R te verwijderen
Hoe de substring-functie te gebruiken in R
Hoe de str_pad-functie in R te gebruiken