Hoe read.table in r te gebruiken (met voorbeelden)
U kunt de functie read.table gebruiken om een bestand met tabelgegevens in R te lezen.
Deze functie gebruikt de volgende basissyntaxis:
df <- read. table (file=' C:\\Users\\bob\\Desktop\\data.txt ', header= FALSE , sep = "")
Standaard gaat de functie read.table ervan uit dat er geen koprijen in het bestand voorkomen en dat waarden worden gescheiden door spaties.
U kunt echter de argumenten header en sep gebruiken om R te vertellen dat het bestand een kopregel heeft en een ander scheidingsteken gebruikt.
U kunt er bijvoorbeeld voor kiezen om een komma als scheidingsteken te gebruiken:
df <- read. table (file=' C:\\Users\\bob\\Desktop\\data.txt ', header= TRUE , sep=' , ')
Het volgende stapsgewijze voorbeeld laat zien hoe u de read.table- functie in de praktijk kunt gebruiken.
Stap 1: Bekijk het bestand
Laten we zeggen dat ik een bestand met de naam data.txt op mijn bureaublad heb dat ik in R wil inlezen als een gegevensblok:
Stap 2: Gebruik read.table() om het bestand in het dataframe te lezen
Laten we vervolgens read.table() gebruiken om het bestand in een dataframe met de naam df te lezen:
#read file from Desktop into data frame df <- read. table (file=' C:\\Users\\bob\\Desktop\\data.txt ', header= TRUE )
Merk op dat ik header=TRUE heb opgegeven, omdat de eerste regel van het bestand de kolomnamen bevat.
Ik heb ook het sep- argument niet gespecificeerd, omdat de bestandsgegevens al door spaties zijn gescheiden.
Stap 3: Bekijk het dataframe
Vervolgens kunnen we het dataframe bekijken om er zeker van te zijn dat het bestand correct is gelezen:
#view data frame print (df) var1 var2 var3 1 1 7 3 2 2 3 7 3 3 3 8 4 4 4 3 5 5 5 2 6 6 7 7 7 9 9 4
We kunnen zien dat het dataframe overeenkomt met de gegevens in het bestand.
We kunnen ook de klasse- en dim -functies gebruiken om de klasse van het dataframe te controleren en de afmetingen te verkrijgen (aantal rijen en aantal kolommen):
#check class of data frame class(df) [1] "data.frame" #check dimensions of data frame dim(df) [1] 7 3
We kunnen zien dat df inderdaad een dataframe is en 7 rijen en 3 kolommen heeft.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere bestandstypen in R kunt lezen:
CSV-bestanden importeren in R
Excel-bestanden importeren in R
TSV-bestanden importeren in R