複数の pandas dataframe を追加する方法 (例付き)
次の基本構文を使用して、複数の pandas DataFrame を一度に追加できます。
import pandas as pd #append multiple DataFrames df_big = pd. concat ([df1,df2, df3], ignore_index= True )
この特定の構文は、 df1 、 df2 、およびdf3 をdf_bigという名前の単一の pandas DataFrame に追加します。
次の例は、この構文を実際に使用する方法を示しています。
例 1: 複数の Pandas DataFrame を一度に追加する
次のコードは、複数のパンダ DataFrame を一度に追加する方法を示しています。
import pandas as pd #create three DataFrames df1 = pd. DataFrame ({'player': ['A', 'B', 'C', 'D', 'E'], 'points':[12, 5, 13, 17, 27]}) df2 = pd. DataFrame ({'player': ['F', 'G', 'H', 'I', 'J'], 'points':[24, 26, 27, 27, 12]}) df3 = pd. DataFrame ({'player': ['K', 'L', 'M', 'N', 'O'], 'points':[9, 5, 5, 13, 17]}) #append all DataFrames into one DataFrame df_big = pd. concat ([df1,df2, df3], ignore_index= True ) #view resulting DataFrame print (df_big) player points 0 to 12 1 B 5 2 C 13 3 D 17 4 E 27 5 F 24 6 G 26 7:27 a.m. 8 I 27 9 D 12 10K 9 11 L 5 12 M 5 13 N 13 14 O 17
結果は、3 つの個別の DataFrame のそれぞれからのすべての行を含む大きな DataFrame になります。
ignore_index=True引数は、各 DataFrame の元のインデックス番号を無視し、新しい DataFrame に対して 0 から始まる新しいインデックスを作成するようにパンダに指示します。
たとえば、次の 2 つの DataFrame をスタックするときに、 ignore_index=Trueを使用しないとどうなるかを考えてみましょう。
import pandas as pd #create two DataFrames with indices df1 = pd. DataFrame ({'player': ['A', 'B', 'C', 'D', 'E'], 'points':[12, 5, 13, 17, 27]}, index=[0, 1, 2, 3, 4]) df2 = pd. DataFrame ({'player': ['F', 'G', 'H', 'I', 'J'], 'points':[24, 26, 27, 27, 12]}, index=[2, 4, 5, 6, 9]) #stack the two DataFrames together df_big = pd. concat ([df1,df2]) #view resulting DataFrame print (df_big) player points 0 to 12 1 B 5 2 C 13 3 D 17 4 E 27 2 F 24 4G 26 5:27 a.m. 6 I 27 9 D 12
結果の DataFrame は、両方の DataFrame からの元のインデックス値を保持しました。
通常、元のインデックス値を保持する特別な理由がない限り、複数の DataFrame を追加する場合は、 ignore_index=Trueを使用する必要があります。
追加リソース
Pandas DataFrame に空の列を追加する方法
Pandas DataFrame に列を挿入する方法
Pandas DataFrame を Excel にエクスポートする方法