Pandas: como usar loc para selecionar múltiplas colunas


Você pode usar a função loc no pandas para selecionar várias colunas em um DataFrame por rótulo.

Aqui estão as maneiras mais comuns de fazer isso:

Método 1: selecione várias colunas por nome

 df. loc [:,[' col2 ',' col4 ']]

Método 2: selecione todas as colunas do intervalo

 df. loc [:, ' col2 ':' col4 ']

Os exemplos a seguir mostram como usar cada método na prática com o seguinte DataFrame do pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' assists ': [11, 8, 10, 6, 6, 5, 9, 12],
                   ' rebounds ': [6, 7, 7, 6, 10, 12, 10, 9]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 5 11 6
1 To 7 8 7
2 To 7 10 7
3 to 9 6 6
4 B 12 6 10
5 B 9 5 12
6 B 9 9 10
7 B 4 12 9

Exemplo 1: selecione várias colunas por nome

O código a seguir mostra como usar a função loc para selecionar as colunas “pontos” e “rejeições” do DataFrame:

 #select points and rebounds columns
df. loc [:,[' points ',' rebounds ']]

        rebound points
0 5 6
1 7 7
2 7 7
3 9 6
4 12 10
5 9 12
6 9 10
7 4 9

Observe que cada linha nas colunas “pontos” e “rebotes” é retornada.

Observe também que a ordem em que você especifica as colunas na função loc é a ordem em que elas serão retornadas.

Por exemplo, poderíamos retornar primeiro a coluna “rebotes” e depois a coluna “pontos”:

 #select rebounds and points columns
df. loc [:, [' rebounds ', ' points ']]

	rebound points
0 6 5
1 7 7
2 7 7
3 6 9
4 10 12
5 12 9
6 10 9
7 9 4

Exemplo 2: selecione todas as colunas do intervalo

O código a seguir mostra como usar a função loc para selecionar todas as colunas entre as colunas “pontos” e “rejeições” no DataFrame:

 #select all columns between points and rebounds columns
df. loc [:, ' points ': ' rebounds ']

	points assists rebounds
0 5 11 6
1 7 8 7
2 7 10 7
3 9 6 6
4 12 6 10
5 9 5 12
6 9 9 10
7 4 12 9

Observe que todas as colunas entre as colunas “pontos” e “rejeições” no DataFrame são retornadas.

Nota : Para selecionar colunas por posição de índice, use a função iloc .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:

Como selecionar linhas com base em múltiplas condições usando Pandas Loc
Como selecionar linhas com base nos valores das colunas no Pandas
Como selecionar linhas por índice no Pandas

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *