Pandas : Comment convertir des colonnes spécifiques en tableau NumPy



Vous pouvez utiliser les méthodes suivantes pour convertir des colonnes spécifiques d’un DataFrame pandas en un tableau NumPy :

Méthode 1 : convertir une colonne en tableau NumPy

column_to_numpy = df['col1'].to_numpy()

Méthode 2 : convertir plusieurs colonnes en tableau NumPy

columns_to_numpy = df[['col1', 'col3', 'col4']].to_numpy()

Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   'points': [18, 22, 19, 14, 14, 11, 20, 28],
                   'assists': [5, 7, 7, 9, 12, 9, 9, 4],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print(df)

  team  points  assists  rebounds
0    A      18        5        11
1    B      22        7         8
2    C      19        7        10
3    D      14        9         6
4    E      14       12         6
5    F      11        9         5
6    G      20        9         9
7    H      28        4        12

Exemple 1 : convertir une colonne en tableau NumPy

Le code suivant montre comment convertir la colonne de points du DataFrame en un tableau NumPy :

#convert points column to NumPy array
column_to_numpy = df['points'].to_numpy()

#view result
print(column_to_numpy)

[18 22 19 14 14 11 20 28]

Nous pouvons confirmer que le résultat est bien un tableau NumPy en utilisant la fonction type() :

#view data type
print(type(column_to_numpy))

<class 'numpy.ndarray'>

Exemple 2 : convertir plusieurs colonnes en tableau NumPy

Le code suivant montre comment convertir les colonnes team et assists du DataFrame en un tableau NumPy multidimensionnel :

#convert team and assists columns to NumPy array
columns_to_numpy = df[['team', 'assists']].to_numpy()

#view result
print(columns_to_numpy)

[['A' 5]
 ['B' 7]
 ['C' 7]
 ['D' 9]
 ['E' 12]
 ['F' 9]
 ['G' 9]
 ['H' 4]]

Nous pouvons confirmer que le résultat est bien un tableau NumPy en utilisant la fonction type() :

#view data type
print(type(columns_to_numpy))

<class 'numpy.ndarray'>

Nous pouvons également utiliser la fonction shape pour afficher la forme du tableau NumPy résultant :

#view shape of array
print(columns_to_numpy.shape)

(8, 2)

Nous pouvons voir que le tableau NumPy résultant comporte 8 lignes et 2 colonnes.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans NumPy :

Comment supprimer des éléments spécifiques du tableau NumPy
Comment remplacer des éléments dans un tableau NumPy
Comment obtenir une ligne spécifique à partir d’un tableau NumPy

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *