Hoe het gegevenstype in r te controleren (met voorbeelden)


U kunt de volgende functies gebruiken om het gegevenstype van variabelen in R te controleren:

 #check data type of one variable
class(x)

#check data type of every variable in data frame
str(df)

#check if a variable is a specific data type
is. factor (x)
is. numeric (x)
is. logical (x)

De volgende voorbeelden laten zien hoe u deze functies in de praktijk kunt gebruiken.

Voorbeeld 1: Controleer het gegevenstype van een variabele

De volgende code laat zien hoe u het gegevenstype van een variabele in R kunt controleren:

 #define variable x
x <- c(“ Andy ”, “ Bob ”, “ Chad ”, “ Dave ”, “ Eric ”, “ Frank ”)

#check data type of x
class(x)

[1] “character”

We kunnen zien dat x een karaktervariabele is.

Voorbeeld 2: Controleer het gegevenstype van elke variabele in het gegevensframe

De volgende code laat zien hoe u het gegevenstype van elke variabele in een gegevensframe kunt controleren:

 #create data frame
df <- data. frame (x=c(1, 3, 4, 4, 6),
                 y=c("A", "B", "C", "D", "E"),
                 z=c(TRUE, TRUE, FALSE, TRUE, FALSE))

#view data frame
df

  X Y Z
1 1 A TRUE
2 3 B TRUE
3 4 C FALSE
4 4 D TRUE
5 6 E FALSE

#find data type of every variable in data frame
str(df)

'data.frame': 5 obs. of 3 variables:
 $x:num 1 3 4 4 6
 $y: chr "A" "B" "C" "D" ...
 $ z: logi TRUE TRUE FALSE TRUE FALSE

Uit het resultaat kunnen we zien:

  • De variabele x is een numerieke variabele.
  • De variabele y is een karaktervariabele .
  • Variabele z is een logische variabele.

Voorbeeld 3: Controleer of de variabele een specifiek gegevenstype is

De volgende code laat zien hoe u kunt controleren of een specifieke variabele in een dataframe een numerieke variabele is:

 #create data frame
df <- data. frame (x=c(1, 3, 4, 4, 6),
                 y=c("A", "B", "C", "D", "E"),
                 z=c(TRUE, TRUE, FALSE, TRUE, FALSE))

#check if x column is numeric
is. numeric (df$x)

[1] TRUE

Omdat de uitvoer TRUE retourneert, geeft dit aan dat kolom x in het gegevensframe numeriek is.

We kunnen ook de functie sapply() gebruiken om te controleren of elke kolom in het dataframe numeriek is:

 #check if every column in data frame is numeric
sapply(df, is.numeric )

    xyz TRUE FALSE FALSE 

We kunnen zien dat kolom x numeriek is, terwijl kolommen y en z dat niet zijn.

Aanvullende bronnen

Hoe factor naar karakter te converteren in R
Hoe teken naar numeriek te converteren in R
Hoe getallen naar datums in R te converteren
Hoe tekenreeksen naar datums in R te converteren

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert