Как использовать функцию readlines() в r (с примерами)


Функцию readLines() в R можно использовать для чтения всех или части строк текста из объекта соединения.

Эта функция использует следующий синтаксис:

 readLines(con, n=-1L)

Золото:

  • недостаток: объект соединения или строка символов
  • n: максимальное количество строк для чтения. По умолчанию читаются все строки.

Следующие примеры показывают, как использовать эту функцию на практике со следующим текстовым файлом some_data.txt :

функция readLines в R

Пример 1. Используйте readLines() для чтения всех строк из текстового файла.

Допустим, текстовый файл сохранен в папке «Мои документы» на моем компьютере.

Я могу использовать следующую функцию readLines() для чтения каждой строки из этого текстового файла:

 #read every line from some_data.txt
readLines("C:/Users/Bob/Documents/some_data.txt")

[1] “The first line of the file” “The second line of the file”
[3] “The third line of the file” “The fourth line of the file”
[5] "The fifth line of the file" "The sixth line of the file"  

Текстовый файл содержит 6 строк, поэтому функция readLines() создает вектор символов длиной 6.

Если я захочу, я могу вместо этого сохранить строки текстового файла во фрейме данных:

 #read every line from some_data.txt
my_data <- readLines("C:/Users/Bob/Documents/some_data.txt")

#create data frame
df = data. frame (values=my_data)

#view data frame
df

                       values
1 The first line of the file
2 The second line of the file
3 The third line of the file
4 The fourth line of the file
5 The fifth line of the file
6 The sixth line of the file

Результатом является фрейм данных с одним столбцом и шестью строками.

Пример 2. Используйте readLines() для чтения первых N строк текстового файла.

Предположим еще раз, что текстовый файл сохранен в папке «Документы» на моем компьютере.

Я могу использовать следующую функцию readLines() с аргументом n , чтобы прочитать только первые n строк этого текстового файла:

 #read first 4 lines from some_data.txt
readLines("C:/Users/Bob/Documents/some_data.txt", n= 4 )

[1] “The first line of the file” “The second line of the file”
[3] “The third line of the file” “The fourth line of the file”

Функция readLines() создает вектор символов длиной 4.

Я также могу использовать квадратные скобки для перехода к определенной строке в этом текстовом файле.

Например, я могу использовать следующий код для доступа только ко второй строке вектора символов:

 #read first 4 lines from some_data.txt
my_data <- readLines("C:/Users/Bob/Documents/some_data.txt", n= 4 )

#display second line only
my_data[2]

[1] "The second line of the file"

Дополнительные ресурсы

В следующих руководствах объясняется, как импортировать файлы других типов в R:

Как использовать read.table в R
Как импортировать файлы CSV в R
Как импортировать файлы Excel в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *