Як використовувати rbind у python (еквівалент r)


Функція rbind у R, скорочення від row-bind , може бути використана для об’єднання кадрів даних за їхніми рядками.

Ми можемо використовувати функцію pandas concat() для виконання еквівалентної функції в Python:

 df3 = pd. concat ([df1, df2])

Наступні приклади показують, як використовувати цю функцію на практиці.

Приклад 1: використовуйте rbind у Python з рівними стовпцями

Припустімо, що ми маємо наступні два panda DataFrames:

 import pandas as pd

#define DataFrames
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'],
                    ' points ': [99, 91, 104, 88, 108]})

print (df1)

  team points
0 to 99
1 B 91
2 C 104
3 D 88
4 E 108

df2 = pd. DataFrame ({' assists ': ['F', 'G', 'H', 'I', 'J'],
                    ' rebounds ': [91, 88, 85, 87, 95]})

print (df2)

  team points
0 F 91
1 G 88
2:85
3 I 87
4 days 95

Ми можемо використати функцію concat() , щоб швидко зв’язати ці два DataFrame разом за їхніми рядками:

 #row-bind two DataFrames
df3 = pd. concat ([df1, df2])

#view resulting DataFrame
df3

	team points
0 to 99
1 B 91
2 C 104
3 D 88
4 E 108
0 F 91
1 G 88
2:85
3 I 87
4 days 95

Зверніть увагу, що ми також можемо використовувати reset_index() , щоб скинути значення індексу нового DataFrame:

 #row-bind two DataFrames and reset index values
df3 = pd. concat ([df1, df2]). reset_index (drop= True )

#view resulting DataFrame
df3

	team points
0 to 99
1 B 91
2 C 104
3 D 88
4 E 108
5 F 91
6 G 88
7:85 a.m.
8 I 87
9 D 95

Приклад 2: Використання rbind у Python із нерівними стовпцями

Ми також можемо використовувати функцію concat() , щоб зв’язати разом два DataFrame, які мають неоднакову кількість стовпців, і будь-які відсутні значення будуть просто заповнені NaN:

 import pandas as pd

#define DataFrames
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'],
                    ' points ': [99, 91, 104, 88, 108]})

df2 = pd. DataFrame ({' team ': ['F', 'G', 'H', 'I', 'J'],
                    ' points ': [91, 88, 85, 87, 95],
                    ' rebounds ': [24, 27, 27, 30, 35]})

#row-bind two DataFrames
df3 = pd. concat ([df1, df2]). reset_index (drop= True )

#view resulting DataFrame
df3

	team points rebounds
0 to 99 NaN
1 B 91 NaN
2 C 104 NaN
3 D 88 NaN
4 E 108 NaN
5 F 91 24.0
6G 88 27.0
7:85 AM 27.0
8 I 87 30.0
9 D 95 35.0

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові функції в Python:

Як використовувати cbind у Python (еквівалент R)
Як зробити VLOOKUP в Pandas
Як видалити рядки, що містять певне значення в Pandas

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *