Pandas: как преобразовать определенные столбцы в массив numpy


Вы можете использовать следующие методы для преобразования определенных столбцов DataFrame pandas в массив NumPy:

Способ 1: преобразовать столбец в массив NumPy

 column_to_numpy = df[' col1 ']. to_numpy ()

Способ 2: преобразование нескольких столбцов в массив NumPy

 columns_to_numpy = df[[' col1 ', ' col3 ', ' col4 ']]. to_numpy ()

В следующих примерах показано, как использовать каждый метод на практике со следующим DataFrame pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

Пример 1. Преобразование столбца в массив NumPy

Следующий код показывает, как преобразовать столбец точек DataFrame в массив NumPy:

 #convert points column to NumPy array
column_to_numpy = df[' points ']. to_numpy ()

#view result
print (column_to_numpy)

[18 22 19 14 14 11 20 28]

Мы можем подтвердить, что результат действительно является массивом NumPy, используя функцию type() :

 #view data type
print ( type (column_to_numpy))

<class 'numpy.ndarray'>

Пример 2. Преобразование нескольких столбцов в массив NumPy

Следующий код показывает, как преобразовать группу и вспомогательные столбцы DataFrame в многомерный массив NumPy:

 #convert team and assists columns to NumPy array
columns_to_numpy = df[[' team ', ' assists ']]. to_numpy ()

#view result
print (columns_to_numpy)

[['AT 5]
 ['B' 7]
 ['C' 7]
 ['D' 9]
 ['E' 12]
 ['F' 9]
 ['G' 9]
 ['H' 4]]

Мы можем подтвердить, что результат действительно является массивом NumPy, используя функцию type() :

 #view data type
print ( type (columns_to_numpy))

<class 'numpy.ndarray'>

Мы также можем использовать функцию shape для отображения формы результирующего массива NumPy:

 #view shape of array
print (columns_to_numpy. shape )

(8, 2)

Мы видим, что полученный массив NumPy имеет 8 строк и 2 столбца.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в NumPy:

Как удалить определенные элементы из массива NumPy
Как заменить элементы в массиве NumPy
Как получить определенную строку из массива NumPy

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *