Jak używać rbind w pythonie (odpowiednik r)


Funkcja rbind w języku R, skrót od row-bind , może być używana do łączenia ramek danych za pomocą ich wierszy.

Możemy użyć funkcji pandas concat() , aby wykonać równoważną funkcję w Pythonie:

 df3 = pd. concat ([df1, df2])

Poniższe przykłady pokazują, jak w praktyce wykorzystać tę funkcję.

Przykład 1: Użyj rbind w Pythonie z równymi kolumnami

Załóżmy, że mamy następujące dwie ramki danych pandy:

 import pandas as pd

#define DataFrames
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'],
                    ' points ': [99, 91, 104, 88, 108]})

print (df1)

  team points
0 to 99
1 B 91
2 C 104
3 D 88
4 E 108

df2 = pd. DataFrame ({' assists ': ['F', 'G', 'H', 'I', 'J'],
                    ' rebounds ': [91, 88, 85, 87, 95]})

print (df2)

  team points
0 F 91
1 G 88
2:85
3 I 87
4 days 95

Możemy użyć funkcji concat() , aby szybko połączyć te dwie ramki danych za pomocą ich linii:

 #row-bind two DataFrames
df3 = pd. concat ([df1, df2])

#view resulting DataFrame
df3

	team points
0 to 99
1 B 91
2 C 104
3 D 88
4 E 108
0 F 91
1 G 88
2:85
3 I 87
4 days 95

Zauważ, że możemy również użyć reset_index() do zresetowania wartości indeksu nowej ramki DataFrame:

 #row-bind two DataFrames and reset index values
df3 = pd. concat ([df1, df2]). reset_index (drop= True )

#view resulting DataFrame
df3

	team points
0 to 99
1 B 91
2 C 104
3 D 88
4 E 108
5 F 91
6 G 88
7:85 a.m.
8 I 87
9 D 95

Przykład 2: Używanie rbind w Pythonie z nierównymi kolumnami

Możemy również użyć funkcji concat() , aby połączyć ze sobą dwie ramki DataFrame, które mają nierówną liczbę kolumn, a wszelkie brakujące wartości zostaną po prostu uzupełnione NaN:

 import pandas as pd

#define DataFrames
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'],
                    ' points ': [99, 91, 104, 88, 108]})

df2 = pd. DataFrame ({' team ': ['F', 'G', 'H', 'I', 'J'],
                    ' points ': [91, 88, 85, 87, 95],
                    ' rebounds ': [24, 27, 27, 30, 35]})

#row-bind two DataFrames
df3 = pd. concat ([df1, df2]). reset_index (drop= True )

#view resulting DataFrame
df3

	team points rebounds
0 to 99 NaN
1 B 91 NaN
2 C 104 NaN
3 D 88 NaN
4 E 108 NaN
5 F 91 24.0
6G 88 27.0
7:85 AM 27.0
8 I 87 30.0
9 D 95 35.0

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe funkcje w Pythonie:

Jak używać cbind w Pythonie (odpowiednik R)
Jak wykonać WYSZUKAJ.PIONOWO w Pandach
Jak usunąć wiersze zawierające określoną wartość w Pandach

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *