Comment utiliser la fonction readLines() dans R (avec exemples)
La fonction readLines() dans R peut être utilisée pour lire tout ou partie des lignes de texte d’un objet de connexion.
Cette fonction utilise la syntaxe suivante :
readLines(con, n=-1L)
où:
- inconvénient : un objet de connexion ou une chaîne de caractères
- n : Le nombre maximum de lignes à lire. La valeur par défaut est de lire toutes les lignes.
Les exemples suivants montrent comment utiliser cette fonction en pratique avec le fichier texte suivant appelé some_data.txt :
Exemple 1 : utilisez readLines() pour lire toutes les lignes d’un fichier texte
Supposons que le fichier texte soit enregistré dans mon dossier Documents sur mon ordinateur.
Je peux utiliser la fonction readLines() suivante pour lire chaque ligne de ce fichier texte :
#read every line from some_data.txt
readLines("C:/Users/Bob/Documents/some_data.txt")
[1] "The first line of the file" "The second line of the file"
[3] "The third line of the file" "The fourth line of the file"
[5] "The fifth line of the file" "The sixth line of the file"
Le fichier texte contient 6 lignes, donc la fonction readLines() produit un vecteur de caractères de longueur 6.
Si je le souhaite, je peux plutôt enregistrer les lignes du fichier texte dans un bloc de données :
#read every line from some_data.txt
my_data <- readLines("C:/Users/Bob/Documents/some_data.txt")
#create data frame
df = data.frame(values=my_data)
#view data frame
df
values
1 The first line of the file
2 The second line of the file
3 The third line of the file
4 The fourth line of the file
5 The fifth line of the file
6 The sixth line of the file
Le résultat est un bloc de données avec une colonne et six lignes.
Exemple 2 : utilisez readLines() pour lire les N premières lignes d’un fichier texte
Supposons encore une fois que le fichier texte soit enregistré dans mon dossier Documents sur mon ordinateur.
Je peux utiliser la fonction readLines() suivante avec l’argument n pour lire uniquement les n premières lignes de ce fichier texte :
#read first 4 lines from some_data.txt
readLines("C:/Users/Bob/Documents/some_data.txt", n=4)
[1] "The first line of the file" "The second line of the file"
[3] "The third line of the file" "The fourth line of the file"
La fonction readLines() produit un vecteur de caractères de longueur 4.
Je peux également utiliser des crochets pour accéder à une ligne spécifique de ce fichier texte.
Par exemple, je peux utiliser le code suivant pour accéder uniquement à la deuxième ligne du vecteur de caractères :
#read first 4 lines from some_data.txt
my_data <- readLines("C:/Users/Bob/Documents/some_data.txt", n=4)
#display second line only
my_data[2]
[1] "The second line of the file"
Ressources additionnelles
Les didacticiels suivants expliquent comment importer d’autres types de fichiers dans R :
Comment utiliser read.table dans R
Comment importer des fichiers CSV dans R
Comment importer des fichiers Excel dans R