Перетворення pandas dataframe на масив numpy (з прикладами)


Ви можете використовувати такий синтаксис, щоб перетворити pandas DataFrame на масив NumPy:

 df. to_numpy ()

Наступні приклади показують, як використовувати цей синтаксис на практиці.

Приклад 1: перетворення DataFrame з тими самими типами даних

У наведеному нижче коді показано, як перетворити pandas DataFrame на масив NumPy, коли всі стовпці в DataFrame належать до одного типу даних:

 import pandas as pd

#create data frame
df1 = pd. DataFrame ({' rebounds ': [7, 7, 8, 13, 7, 4],
                    ' points ': [5, 7, 7, 9, 12, 9],
                    ' assists ': [11, 8, 10, 6, 6, 5]})

#view data frame
print (df1)

   rebound points assists
0 7 5 11
1 7 7 8
2 8 7 10
3 13 9 6
4 7 12 6
5 4 9 5

#convert DataFrame to NumPy array
new = df1. to_numpy ()

#view NumPy array
print (new)

[[ 7 5 11]
 [7 7 8]
 [8 7 10]
 [13 9 6]
 [7 12 6]
 [4 9 5]]

#confirm that new is a NumPy array
print (type(new))

<class 'numpy.ndarray'> 

#view data type
print (new. dtype )

int64

Масив Numpy має тип даних int64 , оскільки кожен стовпець в оригінальному pandas DataFrame був int.

Приклад 2: перетворення DataFrame зі змішаними типами даних

У наведеному нижче коді показано, як перетворити pandas DataFrame на масив NumPy, якщо стовпці в DataFrame не мають одного типу даних:

 import pandas as pd

#create data frame
df2 = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F'],
                    ' points ': [5, 7, 7, 9, 12, 9],
                    ' assists ': [11, 8, 10, 6, 6, 5]})

#view data frame
print (df2)

  player points assists
0 to 5 11
1 B 7 8
2 C 7 10
3 D 9 6
4 E 12 6
5 F 9 5

#convert DataFrame to NumPy array
new = df2. to_numpy ()

#view NumPy array
print (new)

[['A' 5 11]
 ['B' 7 8]
 ['C' 7 10]
 ['D' 9 6]
 ['E' 12 6]
 ['F' 9 5]]

#confirm that new is a NumPy array
print (type(new))

<class 'numpy.ndarray'> 

#view data type
print (new. dtype )

object

Масив Numpy має тип даних Object , оскільки не всі стовпці в оригінальному pandas DataFrame були одного типу даних.

Приклад 3: перетворіть DataFrame і встановіть значення NA

Наступний код показує, як перетворити pandas DataFrame на масив NumPy і вказати значення, які потрібно встановити для всіх значень NA у вихідному DataFrame:

 import pandas as pd

#create data frame
df3 = pd. DataFrame ({' player ': ['A', 'B', pd. NA , 'D', 'E', 'F'],
                    ' points ': [5, 7, pd. NA , 9, pd. NA , 9],
                    ' assists ': [11, 8, 10, 6, 6, 5]})

#view data frame
print (df3)

  player points assists
0 to 5 11
1 B 7 8
2 <NA> <NA> 10
3 D 9 6
4 E <NA> 6
5 F 9 5

#convert DataFrame to NumPy array
new = df3. to_numpy (na_value=' none ')

#view NumPy array
print (new)

[['A' 5 11]
 ['B' 7 8]
 ['none' 'none' 10]
 ['D' 9 6]
 ['E' 'none' 6]
 ['F' 9 5]]

#confirm that new is a NumPy array
print (type(new))

<class 'numpy.ndarray'> 

#view data type
print (new. dtype )

object

Додаткові ресурси

Як створити Pandas DataFrame з масиву NumPy
Як перетворити список на DataFrame у Pandas
Як перетворити DataFrame на список у Pandas

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *