So wählen sie bestimmte spalten in r aus: mit beispielen


Sie können die folgende Syntax verwenden, um bestimmte Spalten in einem R-basierten Datenrahmen auszuwählen:

 #select columns by name
df[c(' col1 ', ' col2 ', ' col4 ')]

#select columns by index
df[c(1, 2, 4)]

Alternativ können Sie die Funktion select() aus dem dplyr- Paket verwenden:

 library (dplyr)

#select columns by name
df %>%
  select(col1, col2, col4)

#select columns by index
df %>%
  select(1, 2, 4)

Für extrem große Datensätze wird die Verwendung der dplyr-Methode empfohlen, da die Funktion select() tendenziell schneller ist als Basis-R-Funktionen.

Die folgenden Beispiele zeigen, wie Sie diese beiden Methoden in der Praxis mit dem folgenden Datenrahmen anwenden können:

 #create data frame
df <- data. frame (a=c(1, 3, 4, 6, 8, 9),
                 b=c(7, 8, 8, 7, 13, 16),
                 c=c(11, 13, 13, 18, 19, 22),
                 d=c(12, 16, 18, 22, 29, 38))

#view data frame
df

  abcd
1 1 7 11 12
2 3 8 13 16
3 4 8 13 18
4 6 7 18 22
5 8 13 19 29
6 9 16 22 38

Beispiel 1: Bestimmte Spalten mit Base R (nach Namen) auswählen

Der folgende Code zeigt, wie Sie mithilfe der Basis R bestimmte Spalten nach Namen auswählen:

 #select columns by name
df[c(' a ', ' b ', ' d ')]

  abd
1 1 7 12
2 3 8 16
3 4 8 18
4 6 7 22
5 8 13 29
6 9 16 38

Beispiel 2: Bestimmte Spalten mithilfe der R-Basis auswählen (nach Index)

Der folgende Code zeigt, wie Sie mithilfe der Basis R bestimmte Spalten nach Index auswählen:

 #select columns by index
df[c(1, 2, 4)]

  abd
1 1 7 12
2 3 8 16
3 4 8 18
4 6 7 22
5 8 13 29
6 9 16 38

Beispiel 3: Bestimmte Spalten mit dplyr auswählen (nach Namen)

Der folgende Code zeigt, wie Sie mit dplyr bestimmte Spalten nach Namen auswählen:

 library (dplyr)

#select columns by name
df %>%
  select(a, b, d)

  abd
1 1 7 12
2 3 8 16
3 4 8 18
4 6 7 22
5 8 13 29
6 9 16 38

Beispiel 4: Bestimmte Spalten mit dplyr auswählen (nach Index)

Der folgende Code zeigt, wie Sie mit dplyr bestimmte Spalten nach Index auswählen:

 library (dplyr)

#select columns by index
df %>%
  select(1, 2, 4)

  abd
1 1 7 12
2 3 8 16
3 4 8 18
4 6 7 22
5 8 13 29
6 9 16 38

Zusätzliche Ressourcen

So fügen Sie eine Spalte zu einem Datenrahmen in R hinzu
So iterieren Sie über Spaltennamen in R
So sortieren Sie einen Datenrahmen nach Spalte in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert