Pandas: como converter colunas específicas em array numpy


Você pode usar os seguintes métodos para converter colunas específicas de um DataFrame do pandas em um array NumPy:

Método 1: converter coluna em array NumPy

 column_to_numpy = df[' col1 ']. to_numpy ()

Método 2: converter várias colunas em array NumPy

 columns_to_numpy = df[[' col1 ', ' col3 ', ' col4 ']]. to_numpy ()

Os exemplos a seguir mostram como usar cada método na prática com o seguinte DataFrame do pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

Exemplo 1: Converter uma coluna em um array NumPy

O código a seguir mostra como converter a coluna de pontos do DataFrame em um array NumPy:

 #convert points column to NumPy array
column_to_numpy = df[' points ']. to_numpy ()

#view result
print (column_to_numpy)

[18 22 19 14 14 11 20 28]

Podemos confirmar que o resultado é de fato um array NumPy usando a função type() :

 #view data type
print ( type (column_to_numpy))

<class 'numpy.ndarray'>

Exemplo 2: Converter várias colunas em array NumPy

O código a seguir mostra como converter as colunas de equipe e assistência do DataFrame em uma matriz NumPy multidimensional:

 #convert team and assists columns to NumPy array
columns_to_numpy = df[[' team ', ' assists ']]. to_numpy ()

#view result
print (columns_to_numpy)

[['AT 5]
 ['B' 7]
 ['C' 7]
 ['D' 9]
 ['E' 12]
 ['F' 9]
 ['G' 9]
 ['H' 4]]

Podemos confirmar que o resultado é de fato um array NumPy usando a função type() :

 #view data type
print ( type (columns_to_numpy))

<class 'numpy.ndarray'>

Também podemos usar a função shape para exibir a forma do array NumPy resultante:

 #view shape of array
print (columns_to_numpy. shape )

(8, 2)

Podemos ver que o array NumPy resultante possui 8 linhas e 2 colunas.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns no NumPy:

Como remover elementos específicos do array NumPy
Como substituir elementos em um array NumPy
Como obter uma linha específica de um array NumPy

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *