Comment ajouter plusieurs DataFrames Pandas (avec exemple)



Vous pouvez utiliser la syntaxe de base suivante pour ajouter plusieurs DataFrames pandas à la fois :

import pandas as pd

#append multiple DataFrames
df_big = pd.concat([df1,df2, df3], ignore_index=True) 

Cette syntaxe particulière ajoutera df1 , df2 et df3 dans un seul DataFrame pandas appelé df_big .

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple 1 : ajouter plusieurs DataFrames Pandas à la fois

Le code suivant montre comment ajouter plusieurs DataFrames pandas à la fois :

import pandas as pd

#create three DataFrames
df1 = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E'],
                    'points':[12, 5, 13, 17, 27]})

df2 = pd.DataFrame({'player': ['F', 'G', 'H', 'I', 'J'],
                    'points':[24, 26, 27, 27, 12]})

df3 = pd.DataFrame({'player': ['K', 'L', 'M', 'N', 'O'],
                    'points':[9, 5, 5, 13, 17]})

#append all DataFrames into one DataFrame
df_big = pd.concat([df1,df2, df3], ignore_index=True)

#view resulting DataFrame
print(df_big)

        player	points
0	A	12
1	B	5
2	C	13
3	D	17
4	E	27
5	F	24
6	G	26
7	H	27
8	I	27
9	J	12
10	K	9
11	L	5
12	M	5
13	N	13
14	O	17

Le résultat est un gros DataFrame qui contient toutes les lignes de chacun des trois DataFrames individuels.

L’argument ignore_index=True indique aux pandas d’ignorer les numéros d’index d’origine dans chaque DataFrame et de créer un nouvel index qui commence à 0 pour le nouveau DataFrame.

Par exemple, considérons ce qui se passe lorsque nous n’utilisons pas ignore_index=True lors de l’empilement des deux DataFrames suivants :

import pandas as pd

#create two DataFrames with indices
df1 = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E'],
                    'points':[12, 5, 13, 17, 27]},
                    index=[0, 1, 2, 3, 4])

df2 = pd.DataFrame({'player': ['F', 'G', 'H', 'I', 'J'],
                    'points':[24, 26, 27, 27, 12]},
                    index=[2, 4, 5, 6, 9])

#stack the two DataFrames together
df_big = pd.concat([df1,df2])

#view resulting DataFrame
print(df_big)

        player	points
0	A	12
1	B	5
2	C	13
3	D	17
4	E	27
2	F	24
4	G	26
5	H	27
6	I	27
9	J	12

Le DataFrame résultant a conservé ses valeurs d’index d’origine des deux DataFrames.

En général, vous devez utiliser ignore_index=True lors de l’ajout de plusieurs DataFrames, sauf si vous avez une raison spécifique de conserver les valeurs d’index d’origine.

Ressources additionnelles

Comment ajouter une colonne vide à un DataFrame Pandas
Comment insérer une colonne dans un DataFrame Pandas
Comment exporter un DataFrame Pandas vers Excel

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *