Como definir a coluna do quadro de dados como índice em r (com exemplo)


Dataframes em R não possuem uma coluna de “índice” como os dataframes em pandas.

No entanto, os quadros de dados em R possuem nomes de linhas , que agem da mesma forma que uma coluna de índice.

Você pode usar qualquer um dos seguintes métodos para definir uma coluna de quadro de dados existente como nomes de linha para um quadro de dados em R:

Método 1: definir nomes de linhas usando base R

 #set specific column as row names
rownames(df) <- df$my_column

#remove original column from data frame
df$my_column <- NULL

Método 2: definir nomes de linhas usando o pacote Tidyverse

 library (tidyverse)

#set specific column as row names
df <- df %>% column_to_rownames(., var = ' my_column ')

Método 3: definir nomes de linhas ao importar dados

 #import CSV file and specify column to use as row names
df <- read. csv (' my_data.csv ', row.names =' my_column ')

Os exemplos a seguir mostram como usar cada método na prática.

Exemplo 1: Definir nomes de linhas usando Base R

Suponha que temos o seguinte quadro de dados em R:

 #create data frame
df <- data. frame (ID=c(101, 102, 103, 104, 105),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28))

#view data frame
df

   ID points assists rebounds
1 101 99 33 30
2 102 90 28 28
3 103 86 31 24
4 104 88 39 24
5 105 95 34 28

Podemos usar o seguinte código para definir a coluna ID como nomes de linha:

 #set ID column as row names
rownames(df) <- df$ID

#remove original ID column from data frame
df$ID <- NULL

#view updated data frame
df

    points assists rebounds
101 99 33 30
102 90 28 28
103 86 31 24
104 88 39 24
105 95 34 28

Os valores na coluna ID agora são os nomes das linhas do quadro de dados.

Exemplo 2: Definir nomes de linhas usando o pacote Tidyverse

O código a seguir mostra como usar a função column_to_rownames() do pacote Spiceverse para definir os nomes das linhas iguais à coluna ID no quadro de dados:

 library (tidyverse)

#create data frame
df <- data. frame (ID=c(101, 102, 103, 104, 105),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28))

#set ID column as row names
df <- df %>% column_to_rownames(., var = ' ID ')

#view updated data frame
df

    points assists rebounds
101 99 33 30
102 90 28 28
103 86 31 24
104 88 39 24
105 95 34 28

Observe que este resultado corresponde ao do exemplo anterior.

Exemplo 3: Definir nomes de linhas ao importar dados

Digamos que temos o seguinte arquivo CSV chamado my_data.csv :

Podemos usar o seguinte código para importar o arquivo CSV e definir os nomes das linhas para serem iguais à coluna ID durante a importação:

 #import CSV file and specify ID column to use as row names
df <- read. csv (' my_data.csv ', row.names =' ID ')

#view data frame
df

    points assists rebounds
101 99 33 30
102 90 28 28
103 86 31 24
104 88 39 24
105 95 34 28

Observe que os valores na coluna ID são usados como nomes de linhas no quadro de dados.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:

Como remover linhas do quadro de dados em R com base na condição
Como substituir valores no quadro de dados em R
Como remover colunas do quadro de dados em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *