Hoe de readlines()-functie in r te gebruiken (met voorbeelden)
De functie readLines() in R kan worden gebruikt om alle of een deel van de tekstregels van een verbindingsobject te lezen.
Deze functie gebruikt de volgende syntaxis:
readLines(con, n=-1L)
Goud:
- nadeel: een verbindingsobject of een tekenreeks
- n: Het maximale aantal te lezen regels. De standaardinstelling is om alle regels te lezen.
De volgende voorbeelden laten zien hoe u deze functie in de praktijk kunt gebruiken met het volgende tekstbestand genaamd some_data.txt :
Voorbeeld 1: Gebruik readLines() om alle regels uit een tekstbestand te lezen
Laten we zeggen dat het tekstbestand is opgeslagen in mijn map Documenten op mijn computer.
Ik kan de volgende functie readLines() gebruiken om elke regel uit dit tekstbestand te lezen:
#read every line from some_data.txt
readLines("C:/Users/Bob/Documents/some_data.txt")
[1] “The first line of the file” “The second line of the file”
[3] “The third line of the file” “The fourth line of the file”
[5] "The fifth line of the file" "The sixth line of the file"
Het tekstbestand bevat 6 regels, dus de functie readLines() produceert een tekenvector met lengte 6.
Als ik wil, kan ik in plaats daarvan de regels van het tekstbestand in een dataframe opslaan:
#read every line from some_data.txt
my_data <- readLines("C:/Users/Bob/Documents/some_data.txt")
#create data frame
df = data. frame (values=my_data)
#view data frame
df
values
1 The first line of the file
2 The second line of the file
3 The third line of the file
4 The fourth line of the file
5 The fifth line of the file
6 The sixth line of the file
Het resultaat is een dataframe met één kolom en zes rijen.
Voorbeeld 2: Gebruik readLines() om de eerste N regels van een tekstbestand te lezen
Laten we er opnieuw van uitgaan dat het tekstbestand is opgeslagen in mijn map Documenten op mijn computer.
Ik kan de volgende functie readLines() met argument n gebruiken om alleen de eerste n regels van dit tekstbestand te lezen:
#read first 4 lines from some_data.txt
readLines("C:/Users/Bob/Documents/some_data.txt", n= 4 )
[1] “The first line of the file” “The second line of the file”
[3] “The third line of the file” “The fourth line of the file”
De functie readLines() produceert een tekenvector met lengte 4.
Ik kan ook vierkante haakjes gebruiken om naar een specifieke regel in dit tekstbestand te navigeren.
Ik kan bijvoorbeeld de volgende code gebruiken om alleen toegang te krijgen tot de tweede regel van de tekenvector:
#read first 4 lines from some_data.txt
my_data <- readLines("C:/Users/Bob/Documents/some_data.txt", n= 4 )
#display second line only
my_data[2]
[1] "The second line of the file"
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere bestandstypen in R kunt importeren:
Lees.table gebruiken in R
CSV-bestanden importeren in R
Excel-bestanden importeren in R