Pandas: so vergleichen sie spalten in zwei verschiedenen dataframes


Sie können die folgenden Methoden verwenden, um Spalten aus zwei verschiedenen Panda-DataFrames zu vergleichen:

Methode 1: Zählen Sie übereinstimmende Werte zwischen Spalten

 df1[' my_column ']. isin (df2[' my_column ']). value_counts ()

Methode 2: Übereinstimmende Werte zwischen Spalten anzeigen

 p.d. merge (df1, df2, on=[' my_column '], how=' inner ')

Die folgenden Beispiele zeigen, wie jede Methode mit den folgenden Pandas-DataFrames verwendet wird:

 import numpy as np
import pandas as pd

#create first DataFrame
df1 = pd. DataFrame ({' team ': ['Mavs', 'Rockets', 'Spurs', 'Heat', 'Nets'],
                    ' points ': [22, 30, 15, 17, 14]})

#view DataFrame
print (df1)

      team points
0 Mavs 22
1 Rockets 30
2 Spurs 15
3 Heat 17
4 Nets 14

#create second DataFrame
df2 = pd. DataFrame ({' team ': ['Mavs', 'Thunder', 'Spurs', 'Nets', 'Cavs'],
                    ' points ': [25, 40, 31, 32, 22]})

#view DataFrame
print (df2)

      team points
0 Mavs 25
1 Thunder 40
2 Spurs 31
3 Nets 32
4 Cavs 22

Beispiel 1: Zählen Sie übereinstimmende Werte zwischen Spalten

Der folgende Code zeigt, wie die Anzahl übereinstimmender Werte zwischen Teamspalten in jedem DataFrame gezählt wird:

 #count matching values in team columns
df1[' team ']. isin (df2[' team ']). value_counts ()

True 3
False 2
Name: team, dtype: int64

Wir sehen, dass die beiden DataFrames drei gemeinsame Teamnamen und zwei verschiedene Teamnamen haben.

Beispiel 2: Übereinstimmende Werte zwischen Spalten anzeigen

Der folgende Code zeigt, wie die tatsächlichen Übereinstimmungswerte zwischen Teamspalten in jedem DataFrame angezeigt werden:

 #display matching values between team columns
p.d. merge (df1, df2, on=[' team '], how=' inner ')

	team points_x points_y
0 Mavs 22 25
1 Spurs 15 31
2 Nets 14 32

Aus dem Ergebnis können wir erkennen, dass beide DataFrames in den Teamspalten die folgenden Werte gemeinsam haben:

  • Mavs
  • Sporen
  • Netze

Verwandte Themen: So führen Sie einen Inner Join in Pandas durch (mit Beispiel)

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Pandas ausführen:

So benennen Sie Spalten in Pandas um
So fügen Sie einem Pandas DataFrame eine Spalte hinzu
So ändern Sie die Spaltenreihenfolge in Pandas DataFrame

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert