Hoe read.table in r te gebruiken (met voorbeelden)


U kunt de functie read.table gebruiken om een bestand met tabelgegevens in R te lezen.

Deze functie gebruikt de volgende basissyntaxis:

 df <- read. table (file=' C:\\Users\\bob\\Desktop\\data.txt ', header= FALSE , sep = "")

Standaard gaat de functie read.table ervan uit dat er geen koprijen in het bestand voorkomen en dat waarden worden gescheiden door spaties.

U kunt echter de argumenten header en sep gebruiken om R te vertellen dat het bestand een kopregel heeft en een ander scheidingsteken gebruikt.

U kunt er bijvoorbeeld voor kiezen om een komma als scheidingsteken te gebruiken:

 df <- read. table (file=' C:\\Users\\bob\\Desktop\\data.txt ', header= TRUE , sep=' , ')

Het volgende stapsgewijze voorbeeld laat zien hoe u de read.table- functie in de praktijk kunt gebruiken.

Stap 1: Bekijk het bestand

Laten we zeggen dat ik een bestand met de naam data.txt op mijn bureaublad heb dat ik in R wil inlezen als een gegevensblok:

Stap 2: Gebruik read.table() om het bestand in het dataframe te lezen

Laten we vervolgens read.table() gebruiken om het bestand in een dataframe met de naam df te lezen:

 #read file from Desktop into data frame
df <- read. table (file=' C:\\Users\\bob\\Desktop\\data.txt ', header= TRUE )

Merk op dat ik header=TRUE heb opgegeven, omdat de eerste regel van het bestand de kolomnamen bevat.

Ik heb ook het sep- argument niet gespecificeerd, omdat de bestandsgegevens al door spaties zijn gescheiden.

Stap 3: Bekijk het dataframe

Vervolgens kunnen we het dataframe bekijken om er zeker van te zijn dat het bestand correct is gelezen:

 #view data frame
print (df)

  var1 var2 var3
1 1 7 3
2 2 3 7
3 3 3 8
4 4 4 3
5 5 5 2
6 6 7 7
7 9 9 4

We kunnen zien dat het dataframe overeenkomt met de gegevens in het bestand.

We kunnen ook de klasse- en dim -functies gebruiken om de klasse van het dataframe te controleren en de afmetingen te verkrijgen (aantal rijen en aantal kolommen):

 #check class of data frame
class(df)

[1] "data.frame"

#check dimensions of data frame
dim(df)

[1] 7 3

We kunnen zien dat df inderdaad een dataframe is en 7 rijen en 3 kolommen heeft.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere bestandstypen in R kunt lezen:

CSV-bestanden importeren in R
Excel-bestanden importeren in R
TSV-bestanden importeren in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert