Як додати кілька фреймів даних pandas (з прикладом)
Ви можете використовувати наступний базовий синтаксис, щоб додати кілька панд DataFrames одночасно:
import pandas as pd #append multiple DataFrames df_big = pd. concat ([df1,df2, df3], ignore_index= True )
Цей конкретний синтаксис додасть df1 , df2 і df3 в єдиний DataFrame pandas під назвою df_big .
У наступному прикладі показано, як використовувати цей синтаксис на практиці.
Приклад 1: додайте кілька Pandas DataFrames одночасно
У наведеному нижче коді показано, як додати декілька панд DataFrames одночасно:
import pandas as pd #create three DataFrames df1 = pd. DataFrame ({'player': ['A', 'B', 'C', 'D', 'E'], 'points':[12, 5, 13, 17, 27]}) df2 = pd. DataFrame ({'player': ['F', 'G', 'H', 'I', 'J'], 'points':[24, 26, 27, 27, 12]}) df3 = pd. DataFrame ({'player': ['K', 'L', 'M', 'N', 'O'], 'points':[9, 5, 5, 13, 17]}) #append all DataFrames into one DataFrame df_big = pd. concat ([df1,df2, df3], ignore_index= True ) #view resulting DataFrame print (df_big) player points 0 to 12 1 B 5 2 C 13 3 D 17 4 E 27 5 F 24 6 G 26 7:27 a.m. 8 I 27 9 D 12 10K 9 11 L 5 12 M 5 13 N 13 14 O 17
Результатом є великий DataFrame, який містить усі рядки кожного з трьох окремих DataFrame.
Аргумент ignore_index=True повідомляє pandas ігнорувати оригінальні номери індексів у кожному DataFrame і створювати новий індекс, який починається з 0 для нового DataFrame.
Наприклад, розглянемо, що станеться, якщо ми не використовуємо ignore_index=True під час укладання наступних двох DataFrames:
import pandas as pd #create two DataFrames with indices df1 = pd. DataFrame ({'player': ['A', 'B', 'C', 'D', 'E'], 'points':[12, 5, 13, 17, 27]}, index=[0, 1, 2, 3, 4]) df2 = pd. DataFrame ({'player': ['F', 'G', 'H', 'I', 'J'], 'points':[24, 26, 27, 27, 12]}, index=[2, 4, 5, 6, 9]) #stack the two DataFrames together df_big = pd. concat ([df1,df2]) #view resulting DataFrame print (df_big) player points 0 to 12 1 B 5 2 C 13 3 D 17 4 E 27 2 F 24 4G 26 5:27 a.m. 6 I 27 9 D 12
Отриманий DataFrame зберіг свої вихідні значення індексу з обох DataFrame.
Загалом, ви повинні використовувати ignore_index=True під час додавання кількох DataFrames, якщо у вас немає певної причини зберігати вихідні значення індексу.
Додаткові ресурси
Як додати порожній стовпець до Pandas DataFrame
Як вставити стовпець у Pandas DataFrame
Як експортувати Pandas DataFrame в Excel