R: importe um arquivo csv com nomes de colunas contendo espaços


Se você importar um arquivo CSV para R que contém nomes de colunas com espaços, R substituirá automaticamente os espaços por pontos para que os nomes das colunas tenham nomes de variáveis “válidos”.

Se você deseja importar o arquivo CSV e manter espaços nos nomes das colunas, você deve usar o argumento check.names=FALSE da seguinte forma:

 df <- read. csv (" my_data.csv ", check.names = FALSE )

Isso importará o arquivo CSV para R e preservará espaços nos nomes das colunas.

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo: importe um arquivo CSV para R com nomes de colunas contendo espaços

Digamos que temos o seguinte arquivo CSV chamado basquete.csv :

Observe que existem quatro nomes de colunas no arquivo CSV e dois deles contêm espaços no nome.

Se usarmos a função read.csv() para importar este arquivo CSV, R substituirá automaticamente espaços por pontos:

 #import CSV file
df <- read. csv (' basketball_data.csv ')

#view data frame
df

  team points.scored assists.collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3

Observe que os pontos substituíram os espaços nos nomes de duas colunas por espaços.

Se quiser importar o arquivo CSV e preservar espaços nos nomes das colunas, você pode usar o argumento check.names=FALSE da seguinte forma:

 #import CSV file and keep spaces in column names
df <- read. csv (' basketball_data.csv ', check.names = FALSE )

#view data frame
df

  team points scored assists collected rebounds
1 to 22 10 5
2 B 15 6 5
3 C 33 9 12
4 D 20 14 3
5 E 11 4 3

Observe que os espaços foram preservados nos nomes de duas colunas com espaços.

No entanto, você deve observar que se tentar realizar cálculos usando esses nomes de colunas com espaços, deverá colocá-los entre aspas simples (`), caso contrário receberá um erro.

Por exemplo, se você tentar calcular a soma dos valores na coluna de pontos marcados sem usar aspas simples, receberá um erro:

 #attempt to calculate sum of points scored column
sum(df$points scored)

Error: unexpected symbol in "sum(df$points scored"

Em vez disso, você deve colocar o nome da coluna entre aspas simples (`) da seguinte maneira:

 #calculate sum of points scored column
sum(df$`points scored`)

[1] 101

Observe que não recebemos um erro desta vez.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:

Como ler um CSV de uma URL em R
Como mesclar vários arquivos CSV em R
Como ler linhas específicas de um arquivo CSV em R
Como exportar um dataframe para um arquivo CSV em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *