Come utilizzare la funzione readlines() in r (con esempi)


La funzione readLines() in R può essere utilizzata per leggere tutte o parte delle righe di testo da un oggetto connessione.

Questa funzione utilizza la seguente sintassi:

 readLines(con, n=-1L)

Oro:

  • svantaggio: un oggetto di connessione o una stringa di caratteri
  • n: il numero massimo di righe da leggere. L’impostazione predefinita prevede la lettura di tutte le righe.

I seguenti esempi mostrano come utilizzare in pratica questa funzione con il seguente file di testo chiamato some_data.txt :

Funzione readLines in R

Esempio 1: utilizzare readLines() per leggere tutte le righe da un file di testo

Supponiamo che il file di testo sia salvato nella cartella Documenti sul mio computer.

Posso usare la seguente funzione readLines() per leggere ogni riga da questo file di testo:

 #read every line from some_data.txt
readLines("C:/Users/Bob/Documents/some_data.txt")

[1] “The first line of the file” “The second line of the file”
[3] “The third line of the file” “The fourth line of the file”
[5] "The fifth line of the file" "The sixth line of the file"  

Il file di testo contiene 6 righe, quindi la funzione readLines() produce un vettore di caratteri di lunghezza 6.

Se voglio posso invece salvare le righe del file di testo in un data frame:

 #read every line from some_data.txt
my_data <- readLines("C:/Users/Bob/Documents/some_data.txt")

#create data frame
df = data. frame (values=my_data)

#view data frame
df

                       values
1 The first line of the file
2 The second line of the file
3 The third line of the file
4 The fourth line of the file
5 The fifth line of the file
6 The sixth line of the file

Il risultato è un frame di dati con una colonna e sei righe.

Esempio 2: utilizzare readLines() per leggere le prime N righe di un file di testo

Supponiamo ancora una volta che il file di testo sia salvato nella cartella Documenti del mio computer.

Posso usare la seguente funzione readLines() con argomento n per leggere solo le prime n righe di questo file di testo:

 #read first 4 lines from some_data.txt
readLines("C:/Users/Bob/Documents/some_data.txt", n= 4 )

[1] “The first line of the file” “The second line of the file”
[3] “The third line of the file” “The fourth line of the file”

La funzione readLines() produce un vettore di caratteri di lunghezza 4.

Posso anche utilizzare le parentesi quadre per passare a una riga specifica in questo file di testo.

Ad esempio, posso utilizzare il seguente codice per accedere solo alla seconda riga del vettore di caratteri:

 #read first 4 lines from some_data.txt
my_data <- readLines("C:/Users/Bob/Documents/some_data.txt", n= 4 )

#display second line only
my_data[2]

[1] "The second line of the file"

Risorse addizionali

I seguenti tutorial spiegano come importare altri tipi di file in R:

Come utilizzare read.table in R
Come importare file CSV in R
Come importare file Excel in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *