Comment utiliser la fonction readLines() dans R (avec exemples)



La fonction readLines() dans R peut être utilisée pour lire tout ou partie des lignes de texte d’un objet de connexion.

Cette fonction utilise la syntaxe suivante :

readLines(con, n=-1L)

où:

  • inconvénient : un objet de connexion ou une chaîne de caractères
  • n : Le nombre maximum de lignes à lire. La valeur par défaut est de lire toutes les lignes.

Les exemples suivants montrent comment utiliser cette fonction en pratique avec le fichier texte suivant appelé some_data.txt :

fonction readLines dans R

Exemple 1 : utilisez readLines() pour lire toutes les lignes d’un fichier texte

Supposons que le fichier texte soit enregistré dans mon dossier Documents sur mon ordinateur.

Je peux utiliser la fonction readLines() suivante pour lire chaque ligne de ce fichier texte :

#read every line from some_data.txt
readLines("C:/Users/Bob/Documents/some_data.txt")

[1] "The first line of the file"  "The second line of the file"
[3] "The third line of the file"  "The fourth line of the file"
[5] "The fifth line of the file"  "The sixth line of the file"  

Le fichier texte contient 6 lignes, donc la fonction readLines() produit un vecteur de caractères de longueur 6.

Si je le souhaite, je peux plutôt enregistrer les lignes du fichier texte dans un bloc de données :

#read every line from some_data.txt
my_data <- readLines("C:/Users/Bob/Documents/some_data.txt")

#create data frame
df = data.frame(values=my_data)

#view data frame
df

                       values
1  The first line of the file
2 The second line of the file
3  The third line of the file
4 The fourth line of the file
5  The fifth line of the file
6  The sixth line of the file

Le résultat est un bloc de données avec une colonne et six lignes.

Exemple 2 : utilisez readLines() pour lire les N premières lignes d’un fichier texte

Supposons encore une fois que le fichier texte soit enregistré dans mon dossier Documents sur mon ordinateur.

Je peux utiliser la fonction readLines() suivante avec l’argument n pour lire uniquement les n premières lignes de ce fichier texte :

#read first 4 lines from some_data.txt
readLines("C:/Users/Bob/Documents/some_data.txt", n=4)

[1] "The first line of the file"  "The second line of the file"
[3] "The third line of the file"  "The fourth line of the file"

La fonction readLines() produit un vecteur de caractères de longueur 4.

Je peux également utiliser des crochets pour accéder à une ligne spécifique de ce fichier texte.

Par exemple, je peux utiliser le code suivant pour accéder uniquement à la deuxième ligne du vecteur de caractères :

#read first 4 lines from some_data.txt
my_data <- readLines("C:/Users/Bob/Documents/some_data.txt", n=4)

#display second line only
my_data[2]

[1] "The second line of the file"

Ressources additionnelles

Les didacticiels suivants expliquent comment importer d’autres types de fichiers dans R :

Comment utiliser read.table dans R
Comment importer des fichiers CSV dans R
Comment importer des fichiers Excel dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *