Como definir a coluna do quadro de dados como índice em r (com exemplo)
Dataframes em R não possuem uma coluna de “índice” como os dataframes em pandas.
No entanto, os quadros de dados em R possuem nomes de linhas , que agem da mesma forma que uma coluna de índice.
Você pode usar qualquer um dos seguintes métodos para definir uma coluna de quadro de dados existente como nomes de linha para um quadro de dados em R:
Método 1: definir nomes de linhas usando base R
#set specific column as row names rownames(df) <- df$my_column #remove original column from data frame df$my_column <- NULL
Método 2: definir nomes de linhas usando o pacote Tidyverse
library (tidyverse) #set specific column as row names df <- df %>% column_to_rownames(., var = ' my_column ')
Método 3: definir nomes de linhas ao importar dados
#import CSV file and specify column to use as row names df <- read. csv (' my_data.csv ', row.names =' my_column ')
Os exemplos a seguir mostram como usar cada método na prática.
Exemplo 1: Definir nomes de linhas usando Base R
Suponha que temos o seguinte quadro de dados em R:
#create data frame
df <- data. frame (ID=c(101, 102, 103, 104, 105),
points=c(99, 90, 86, 88, 95),
assists=c(33, 28, 31, 39, 34),
rebounds=c(30, 28, 24, 24, 28))
#view data frame
df
ID points assists rebounds
1 101 99 33 30
2 102 90 28 28
3 103 86 31 24
4 104 88 39 24
5 105 95 34 28
Podemos usar o seguinte código para definir a coluna ID como nomes de linha:
#set ID column as row names
rownames(df) <- df$ID
#remove original ID column from data frame
df$ID <- NULL
#view updated data frame
df
points assists rebounds
101 99 33 30
102 90 28 28
103 86 31 24
104 88 39 24
105 95 34 28
Os valores na coluna ID agora são os nomes das linhas do quadro de dados.
Exemplo 2: Definir nomes de linhas usando o pacote Tidyverse
O código a seguir mostra como usar a função column_to_rownames() do pacote Spiceverse para definir os nomes das linhas iguais à coluna ID no quadro de dados:
library (tidyverse)
#create data frame
df <- data. frame (ID=c(101, 102, 103, 104, 105),
points=c(99, 90, 86, 88, 95),
assists=c(33, 28, 31, 39, 34),
rebounds=c(30, 28, 24, 24, 28))
#set ID column as row names
df <- df %>% column_to_rownames(., var = ' ID ')
#view updated data frame
df
points assists rebounds
101 99 33 30
102 90 28 28
103 86 31 24
104 88 39 24
105 95 34 28
Observe que este resultado corresponde ao do exemplo anterior.
Exemplo 3: Definir nomes de linhas ao importar dados
Digamos que temos o seguinte arquivo CSV chamado my_data.csv :
Podemos usar o seguinte código para importar o arquivo CSV e definir os nomes das linhas para serem iguais à coluna ID durante a importação:
#import CSV file and specify ID column to use as row names df <- read. csv (' my_data.csv ', row.names =' ID ') #view data frame df points assists rebounds 101 99 33 30 102 90 28 28 103 86 31 24 104 88 39 24 105 95 34 28
Observe que os valores na coluna ID são usados como nomes de linhas no quadro de dados.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:
Como remover linhas do quadro de dados em R com base na condição
Como substituir valores no quadro de dados em R
Como remover colunas do quadro de dados em R