如何在python中使用rbind(相当于r)
R 中的rbind函数是row-bind的缩写,可用于按行将数据帧组合在一起。
我们可以使用 pandas concat()函数在 Python 中执行等效函数:
df3 = pd. concat ([df1, df2])
以下示例展示了如何在实践中使用此功能。
示例 1:在 Python 中使用 rbind 并具有相等的列
假设我们有以下两个 panda DataFrame:
import pandas as pd #define DataFrames df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'], ' points ': [99, 91, 104, 88, 108]}) print (df1) team points 0 to 99 1 B 91 2 C 104 3 D 88 4 E 108 df2 = pd. DataFrame ({' assists ': ['F', 'G', 'H', 'I', 'J'], ' rebounds ': [91, 88, 85, 87, 95]}) print (df2) team points 0 F 91 1 G 88 2:85 3 I 87 4 days 95
我们可以使用concat()函数通过行快速将这两个 DataFrame 连接在一起:
#row-bind two DataFrames
df3 = pd. concat ([df1, df2])
#view resulting DataFrame
df3
team points
0 to 99
1 B 91
2 C 104
3 D 88
4 E 108
0 F 91
1 G 88
2:85
3 I 87
4 days 95
注意,我们还可以使用reset_index()来重置新DataFrame的索引值:
#row-bind two DataFrames and reset index values
df3 = pd. concat ([df1, df2]). reset_index (drop= True )
#view resulting DataFrame
df3
team points
0 to 99
1 B 91
2 C 104
3 D 88
4 E 108
5 F 91
6 G 88
7:85 a.m.
8 I 87
9 D 95
示例 2:在 Python 中使用 rbind 和不等列
我们还可以使用concat()函数将两个列数不等的 DataFrame 链接在一起,任何缺失值都将简单地用 NaN 填充:
import pandas as pd #define DataFrames df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'], ' points ': [99, 91, 104, 88, 108]}) df2 = pd. DataFrame ({' team ': ['F', 'G', 'H', 'I', 'J'], ' points ': [91, 88, 85, 87, 95], ' rebounds ': [24, 27, 27, 30, 35]}) #row-bind two DataFrames df3 = pd. concat ([df1, df2]). reset_index (drop= True ) #view resulting DataFrame df3 team points rebounds 0 to 99 NaN 1 B 91 NaN 2 C 104 NaN 3 D 88 NaN 4 E 108 NaN 5 F 91 24.0 6G 88 27.0 7:85 AM 27.0 8 I 87 30.0 9 D 95 35.0
其他资源
以下教程解释了如何在 Python 中执行其他常见功能:
如何在Python中使用cbind(相当于R)
如何在 Pandas 中进行 VLOOKUP
如何删除 Pandas 中包含特定值的行