Как использовать функцию readlines() в r (с примерами)
Функцию readLines() в R можно использовать для чтения всех или части строк текста из объекта соединения.
Эта функция использует следующий синтаксис:
readLines(con, n=-1L)
Золото:
- недостаток: объект соединения или строка символов
- n: максимальное количество строк для чтения. По умолчанию читаются все строки.
Следующие примеры показывают, как использовать эту функцию на практике со следующим текстовым файлом some_data.txt :
Пример 1. Используйте readLines() для чтения всех строк из текстового файла.
Допустим, текстовый файл сохранен в папке «Мои документы» на моем компьютере.
Я могу использовать следующую функцию readLines() для чтения каждой строки из этого текстового файла:
#read every line from some_data.txt
readLines("C:/Users/Bob/Documents/some_data.txt")
[1] “The first line of the file” “The second line of the file”
[3] “The third line of the file” “The fourth line of the file”
[5] "The fifth line of the file" "The sixth line of the file"
Текстовый файл содержит 6 строк, поэтому функция readLines() создает вектор символов длиной 6.
Если я захочу, я могу вместо этого сохранить строки текстового файла во фрейме данных:
#read every line from some_data.txt
my_data <- readLines("C:/Users/Bob/Documents/some_data.txt")
#create data frame
df = data. frame (values=my_data)
#view data frame
df
values
1 The first line of the file
2 The second line of the file
3 The third line of the file
4 The fourth line of the file
5 The fifth line of the file
6 The sixth line of the file
Результатом является фрейм данных с одним столбцом и шестью строками.
Пример 2. Используйте readLines() для чтения первых N строк текстового файла.
Предположим еще раз, что текстовый файл сохранен в папке «Документы» на моем компьютере.
Я могу использовать следующую функцию readLines() с аргументом n , чтобы прочитать только первые n строк этого текстового файла:
#read first 4 lines from some_data.txt
readLines("C:/Users/Bob/Documents/some_data.txt", n= 4 )
[1] “The first line of the file” “The second line of the file”
[3] “The third line of the file” “The fourth line of the file”
Функция readLines() создает вектор символов длиной 4.
Я также могу использовать квадратные скобки для перехода к определенной строке в этом текстовом файле.
Например, я могу использовать следующий код для доступа только ко второй строке вектора символов:
#read first 4 lines from some_data.txt
my_data <- readLines("C:/Users/Bob/Documents/some_data.txt", n= 4 )
#display second line only
my_data[2]
[1] "The second line of the file"
Дополнительные ресурсы
В следующих руководствах объясняется, как импортировать файлы других типов в R:
Как использовать read.table в R
Как импортировать файлы CSV в R
Как импортировать файлы Excel в R