Python'da cbind nasıl kullanılır (r'ye eşdeğer)
R’deki sütun bağlamasının kısaltması olan cbind işlevi, veri çerçevelerini sütunlarına göre birleştirmek için kullanılabilir.
Python’da eşdeğer işlevi gerçekleştirmek için pandas concat() işlevini kullanabiliriz:
df3 = pd. concat ([df1, df2], axis= 1 )
Aşağıdaki örnekler bu fonksiyonun pratikte nasıl kullanılacağını göstermektedir.
Örnek 1: Python’da cbind’i eşit dizin değerleriyle kullanın
Aşağıdaki iki panda DataFrame’e sahip olduğumuzu varsayalım:
import pandas as pd #define DataFrames df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'], ' points ': [99, 91, 104, 88, 108]}) print (df1) team points 0 to 99 1 B 91 2 C 104 3 D 88 4 E 108 df2 = pd. DataFrame ({' assists ': ['A', 'B', 'C', 'D', 'E'], ' rebounds ': [22, 19, 25, 33, 29]}) print (df2) rebound assists 0 to 22 1 B 19 2 C 25 3 D 33 4 E 29
Bu iki DataFrame’i sütunlarıyla hızla birbirine bağlamak için concat() işlevini kullanabiliriz:
#column-bind two DataFrames into new DataFrame
df3 = pd. concat ([df1, df2], axis= 1 )
#view resulting DataFrame
df3
team points assists rebounds
0 to 99 to 22
1 B 91 B 19
2 C 104 C 25
3 D 88 D 33
4 E 108 E 29
Örnek 2: Python’da cbind’i Eşit Olmayan İndeks Değerleriyle Kullanmak
Aşağıdaki iki panda DataFrame’e sahip olduğumuzu varsayalım:
import pandas as pd #define DataFrames df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'], ' points ': [99, 91, 104, 88, 108]}) print (df1) team points 0 to 99 1 B 91 2 C 104 3 D 88 4 E 108 df2 = pd. DataFrame ({' assists ': ['A', 'B', 'C', 'D', 'E'], ' rebounds ': [22, 19, 25, 33, 29]}) df2. index = [6, 7, 8, 9, 10] print (df2) rebound assists 6 to 22 7 B 19 8 C 25 9 D 33 10 E 29
İki DataFrame’in aynı dizin değerlerine sahip olmadığını unutmayın.
Bunları birbirine bağlamak için concat() işlevini kullanmaya çalışırsak aşağıdaki sonucu elde ederiz:
#attempt to column-bind two DataFrames
df3 = pd. concat ([df1, df2], axis= 1 )
#view resulting DataFrame
df3
team points assists rebounds
0 to 99.0 NaN NaN
1 B 91.0 NaN NaN
2 C 104.0 NaN NaN
3 D 88.0 NaN NaN
4 E 108.0 NaN NaN
6 NaN NaN A 22.0
7 NaN NaN B 19.0
8 NaN NaN C 25.0
9 NaN NaN D 33.0
10 NaN NaN E 29.0
Bu istediğimiz sonuç değildi.
Bu sorunu çözmek için, öncelikle her bir DataFrame’i birbirine bağlamadan önce dizinini sıfırlamamız gerekir:
import pandas as pd #define DataFrames df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E'], ' points ': [99, 91, 104, 88, 108]}) df2 = pd. DataFrame ({' assists ': ['A', 'B', 'C', 'D', 'E'], ' rebounds ': [22, 19, 25, 33, 29]}) df2. index = [6, 7, 8, 9, 10] #reset index of each DataFrame df1. reset_index (drop= True , place= True ) df2. reset_index (drop= True , place= True ) #column-bind two DataFrames df3 = pd. concat ([df1, df2], axis= 1 ) #view resulting DataFrame df3 team points assists rebounds 0 to 99 to 22 1 B 91 B 19 2 C 104 C 25 3 D 88 D 33 4 E 108 E 29
Bu DataFrame’in önceki örnekte elde ettiğimizle eşleştiğini unutmayın.
Ek kaynaklar
Aşağıdaki eğitimlerde Python’da diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:
Dizinde iki Pandas DataFrame nasıl birleştirilir
Pandas DataFrames’ı birden çok sütunda birleştirme
Pandas’ta DÜŞEYARA nasıl yapılır