So transponieren sie einen datenrahmen mit dplyr


Sie können die folgende grundlegende Syntax verwenden, um einen Datenrahmen mithilfe des dplyr- Pakets in R zu transponieren:

 library (dplyr)
library (tidyr)

df %>%
    pivot_wider(names_from = column1, values_from = column2)

Das Argument Names_from gibt die Werte an, die für Spaltennamen im transponierten Datenrahmen verwendet werden sollen, und das Argument Values_from gibt die Zellwerte an, die im transponierten Datenrahmen verwendet werden sollen.

Beachten Sie, dass der Pipe-Operator ( %>% ) aus dem dplyr- Paket stammt, während die Funktion „pivot_wider()“ aus dem Tidyr- Paket stammt.

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: Transponieren Sie einen Datenrahmen mit dplyr

Angenommen, wir haben den folgenden Datenrahmen in R, der Informationen über verschiedene Basketballteams enthält:

 #create data frame
df <- data. frame (team=c('Mavs', 'Nets', 'Kings', 'Lakers'),
                 dots=c(99, 104, 119, 113))

#view data frame
df

    team points
1 Mavs 99
2 Nets 104
3 Kings 119
4 Lakers 113

Nehmen wir nun an, wir möchten den Datenrahmen so transponieren, dass Teamnamen als Spaltennamen und Punktwerte als Zellenwerte innerhalb des Datenrahmens verwendet werden.

Wir können dazu die folgende Syntax verwenden:

 library (dplyr)
library (tidyr)

#transpose data frame
df %>%
    pivot_wider(names_from = team, values_from = points)

# A tibble: 1 x 4
   Mavs Nets Kings Lakers
      
1 99 104 119 113

Der Datenrahmen wurde transponiert, sodass Teamnamen als Spalten und Punktwerte als Zellenwerte im Datenrahmen verwendet werden.

Beachten Sie, dass der resultierende Datenrahmen jetzt 1 Zeile und 4 Spalten enthält.

Verwandt: Eine Einführung in die Funktion „pivot_wider()“ in R

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben mit dplyr ausführen:

So filtern Sie Zeilen, die eine bestimmte Zeichenfolge enthalten, mit dplyr
So berechnen Sie relative Häufigkeiten mit dplyr
So wählen Sie mit dplyr die erste Zeile nach Gruppe aus

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert