A: so wählen sie zeilen in einem datenrahmen basierend auf vektorwerten aus


Sie können eine der folgenden Methoden verwenden, um Zeilen aus einem Datenrahmen in R basierend auf den Werten eines Vektors auszuwählen:

Methode 1: Verwenden Sie Base R

 new_df <- df[df$column_name %in% values_vector, ]

Methode 2: Verwenden Sie das dplyr-Paket

 library (dplyr)

new_df <- df %>% filter(column_name %in% values_vector)

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Datenrahmen in R verwendet wird:

 #create data frame
df <- data. frame (division=c('West', 'West', 'East', 'East', 'North'),
                 points=c(120, 100, 104, 98, 105),
                 assists=c(30, 35, 64, 28, 23))

#view data frame
df

  assists points division
1 West 120 30
2 West 100 35
3 East 104 64
4 East 98 28
5 North 105 23

Beispiel 1: Verwenden Sie Base R, um Zeilen basierend auf Vektorwerten auszuwählen

Mit dem folgenden Code können wir nur die Zeilen aus dem ursprünglichen Datenrahmen auswählen, in denen der Wert in der Teilungsspalte „West“ oder „Nord“ entspricht.

 #define values of interest
my_values <- c(' West ', ' North ')

#select rows that contain 'West' or 'North' in division column
new_df <- df[df$division %in% my_values, ]

#view results
new_df

  assists points division
1 West 120 30
2 West 100 35
5 North 105 23

Der neue Datenrahmen enthält nur Zeilen, deren Wert in der Teilungsspalte gleich „West“ oder „Nord“ ist.

Beispiel 2: Verwenden Sie dplyr, um Zeilen basierend auf Vektorwerten auszuwählen

Wir können auch die Funktion filter() aus dem dplyr- Paket in R verwenden, um nur die Zeilen aus dem ursprünglichen Datenrahmen auszuwählen, bei denen der Wert in der Divisionsspalte „West“ oder „Nord“ entspricht.

 library (dplyr)

#define values of interest
my_values <- c(' West ', ' North ')

#select rows that contain 'West' or 'North' in division column
new_df <- df %>% filter(division %in% my_values)

#view results
new_df

  assists points division
1 West 120 30
2 West 100 35
3 North 105 23

Der neue Datenrahmen enthält nur Zeilen, deren Wert in der Teilungsspalte gleich „West“ oder „Nord“ ist.

Hinweis : Die Basis-R- und dplyr-Methoden führen zu denselben Ergebnissen. Allerdings ist die dplyr-Methode tendenziell schneller, wenn mit extrem großen Datenrahmen gearbeitet wird.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:

So wählen Sie zufällige Zeilen in R mit dplyr aus
So wählen Sie Zeilen nach Bedingung in R aus
So wählen Sie Zeilen aus, in denen der Wert in einer beliebigen Spalte in R erscheint

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert