Як використовувати функцію readlines() у r (з прикладами)


Функцію readLines() у R можна використовувати для читання всіх або частини рядків тексту з об’єкта підключення.

Ця функція використовує такий синтаксис:

 readLines(con, n=-1L)

золото:

  • недолік: об’єкт підключення або рядок символів
  • n: Максимальна кількість рядків для читання. За замовчуванням читаються всі рядки.

У наступних прикладах показано, як використовувати цю функцію на практиці з наступним текстовим файлом під назвою some_data.txt :

функція readLines у R

Приклад 1: використовуйте readLines(), щоб прочитати всі рядки з текстового файлу

Припустимо, текстовий файл збережено в папці «Документи» на моєму комп’ютері.

Я можу використовувати таку функцію readLines() , щоб прочитати кожен рядок із цього текстового файлу:

 #read every line from some_data.txt
readLines("C:/Users/Bob/Documents/some_data.txt")

[1] “The first line of the file” “The second line of the file”
[3] “The third line of the file” “The fourth line of the file”
[5] "The fifth line of the file" "The sixth line of the file"  

Текстовий файл містить 6 рядків, тому функція readLines() створює вектор символів довжиною 6.

Якщо я хочу, я можу натомість зберегти рядки текстового файлу у фреймі даних:

 #read every line from some_data.txt
my_data <- readLines("C:/Users/Bob/Documents/some_data.txt")

#create data frame
df = data. frame (values=my_data)

#view data frame
df

                       values
1 The first line of the file
2 The second line of the file
3 The third line of the file
4 The fourth line of the file
5 The fifth line of the file
6 The sixth line of the file

Результатом є кадр даних з одним стовпцем і шістьма рядками.

Приклад 2: використовуйте readLines(), щоб прочитати перші N рядків текстового файлу

Знову припустімо, що текстовий файл збережено в папці «Документи» на комп’ютері.

Я можу використати таку функцію readLines() з аргументом n , щоб прочитати лише перші n рядків цього текстового файлу:

 #read first 4 lines from some_data.txt
readLines("C:/Users/Bob/Documents/some_data.txt", n= 4 )

[1] “The first line of the file” “The second line of the file”
[3] “The third line of the file” “The fourth line of the file”

Функція readLines() створює символьний вектор довжиною 4.

Я також можу використовувати квадратні дужки, щоб перейти до певного рядка в цьому текстовому файлі.

Наприклад, я можу використовувати наступний код для доступу лише до другого рядка вектора символів:

 #read first 4 lines from some_data.txt
my_data <- readLines("C:/Users/Bob/Documents/some_data.txt", n= 4 )

#display second line only
my_data[2]

[1] "The second line of the file"

Додаткові ресурси

У наступних посібниках пояснюється, як імпортувати інші типи файлів у R:

Як використовувати read.table у R
Як імпортувати файли CSV у R
Як імпортувати файли Excel у R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *