Hoe het gegevenstype in r te controleren (met voorbeelden)
U kunt de volgende functies gebruiken om het gegevenstype van variabelen in R te controleren:
#check data type of one variable class(x) #check data type of every variable in data frame str(df) #check if a variable is a specific data type is. factor (x) is. numeric (x) is. logical (x)
De volgende voorbeelden laten zien hoe u deze functies in de praktijk kunt gebruiken.
Voorbeeld 1: Controleer het gegevenstype van een variabele
De volgende code laat zien hoe u het gegevenstype van een variabele in R kunt controleren:
#define variable x
x <- c(“ Andy ”, “ Bob ”, “ Chad ”, “ Dave ”, “ Eric ”, “ Frank ”)
#check data type of x
class(x)
[1] “character”
We kunnen zien dat x een karaktervariabele is.
Voorbeeld 2: Controleer het gegevenstype van elke variabele in het gegevensframe
De volgende code laat zien hoe u het gegevenstype van elke variabele in een gegevensframe kunt controleren:
#create data frame
df <- data. frame (x=c(1, 3, 4, 4, 6),
y=c("A", "B", "C", "D", "E"),
z=c(TRUE, TRUE, FALSE, TRUE, FALSE))
#view data frame
df
X Y Z
1 1 A TRUE
2 3 B TRUE
3 4 C FALSE
4 4 D TRUE
5 6 E FALSE
#find data type of every variable in data frame
str(df)
'data.frame': 5 obs. of 3 variables:
$x:num 1 3 4 4 6
$y: chr "A" "B" "C" "D" ...
$ z: logi TRUE TRUE FALSE TRUE FALSE
Uit het resultaat kunnen we zien:
- De variabele x is een numerieke variabele.
- De variabele y is een karaktervariabele .
- Variabele z is een logische variabele.
Voorbeeld 3: Controleer of de variabele een specifiek gegevenstype is
De volgende code laat zien hoe u kunt controleren of een specifieke variabele in een dataframe een numerieke variabele is:
#create data frame
df <- data. frame (x=c(1, 3, 4, 4, 6),
y=c("A", "B", "C", "D", "E"),
z=c(TRUE, TRUE, FALSE, TRUE, FALSE))
#check if x column is numeric
is. numeric (df$x)
[1] TRUE
Omdat de uitvoer TRUE retourneert, geeft dit aan dat kolom x in het gegevensframe numeriek is.
We kunnen ook de functie sapply() gebruiken om te controleren of elke kolom in het dataframe numeriek is:
#check if every column in data frame is numeric
sapply(df, is.numeric )
xyz TRUE FALSE FALSE
We kunnen zien dat kolom x numeriek is, terwijl kolommen y en z dat niet zijn.
Aanvullende bronnen
Hoe factor naar karakter te converteren in R
Hoe teken naar numeriek te converteren in R
Hoe getallen naar datums in R te converteren
Hoe tekenreeksen naar datums in R te converteren