Como ler linhas específicas de um arquivo csv em r


Você pode usar os seguintes métodos para ler linhas específicas de um arquivo CSV em R:

Método 1: importar um arquivo CSV de uma linha específica

 df <- read. csv (" my_data.csv ", skip= 2 )

Este exemplo específico irá pular as duas primeiras linhas do arquivo CSV e importar todas as outras linhas do arquivo começando pela terceira linha.

Método 2: importe um arquivo CSV onde as linhas atendam à condição

 library (sqldf)

df <- read. csv . sql (" my_data.csv ",
                    sql = " select * from file where `points` > 90 ", eol = " \n ")

Este exemplo específico importará apenas linhas do arquivo CSV cujo valor na coluna “pontos” seja maior que 90.

Os exemplos a seguir mostram como usar cada um desses métodos na prática com o seguinte arquivo CSV chamado my_data.csv :

Exemplo 1: importar um arquivo CSV de uma linha específica

O código a seguir mostra como importar o arquivo CSV e ignorar as duas primeiras linhas do arquivo:

 #import data frame and skip first two rows
df <- read. csv (' my_data.csv ', skip= 2 )

#view data frame
df

  B X90 X28 X28.1
1 C 86 31 24
2 D 88 39 24
3 E 95 34 28

Observe que as duas primeiras linhas (com as equipes A e B) foram ignoradas na importação do arquivo CSV.

Por padrão, R tenta usar os valores da próxima linha disponível como nomes de colunas.

Para renomear colunas, você pode usar a funçãonames() da seguinte forma:

 #rename columns
names(df) <- c(' team ', ' points ', ' assists ', ' rebounds ')

#view updated data frame
df

  team points assists rebounds
1 C 86 31 24
2 D 88 39 24
3 E 95 34 28

Exemplo 2: importe um arquivo CSV onde as linhas atendem à condição

Suponha que queiramos importar apenas as linhas do arquivo CSV cujo valor na coluna de pontos é maior que 90.

Podemos usar a função read.csv.sql do pacote sqldf para fazer isso:

 library (sqldf)

#only import rows where points > 90
df <- read. csv . sql (" my_data.csv ",
                    sql = " select * from file where `points` > 90 ", eol = " \n ")

#view data frame
df

  team points assists rebounds
1 “A” 99 33 30
2 “E” 95 34 28

Observe que foram importadas apenas as duas linhas do arquivo CSV cujo valor na coluna “pontos” é maior que 90.

Nota #1 : Neste exemplo, usamos o argumento eol para especificar que o “fim de linha” no arquivo é indicado por \n , que representa uma nova linha.

Observação nº 2: neste exemplo, usamos uma consulta SQL simples, mas você pode escrever consultas mais complexas para filtrar linhas por ainda mais condições.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:

Como ler um CSV de uma URL em R
Como mesclar vários arquivos CSV em R
Como exportar um quadro de dados para um arquivo CSV em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *