So unterteilen sie einen datenrahmen in r (4 beispiele)

Von Dr. Benjamin Anderson Juli 24, 2023 Führung Keine Kommentare

Sie können die folgende grundlegende Syntax verwenden, um einen Datenrahmen in R zu unterteilen:

 df[rows, columns]

Die folgenden Beispiele zeigen, wie diese Syntax in der Praxis mit dem folgenden Datenrahmen verwendet werden kann:

 #create data frame
df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C', 'C'),
                 points=c(77, 81, 89, 83, 99, 92, 97),
                 assists=c(19, 22, 29, 15, 32, 39, 14))

#view data frame
df

  team points assists
1 A 77 19
2 A 81 22
3 B 89 29
4 B 83 15
5 C 99 32
6 C 92 39
7 C 97 14

Beispiel 1: Teilmenge des Datenrahmens durch Auswahl von Spalten

Der folgende Code zeigt, wie man einen Datenrahmen nach Spaltennamen unterteilt:

 #select all rows for columns 'team' and 'assists'
df[, c(' team ', ' assists ')]

  team assists
1 to 19
2 to 22
3 B 29
4 B 15
5 C 32
6 C 39
7 C 14

Wir können einen Datenrahmen auch nach Spaltenindexwerten unterteilen:

 #select all rows for columns 1 and 3
df[, c(1, 3)]

  team assists
1 to 19
2 to 22
3 B 29
4 B 15
5 C 32
6 C 39
7 C 14

Beispiel 2: Teilmengendatenrahmen ohne Spalten

Der folgende Code zeigt, wie man einen Datenrahmen unterteilt, indem man bestimmte Spaltennamen ausschließt:

 #define columns to exclude
cols <- names(df) %in% c(' points ')

#exclude points column
df[!cols]

  team assists
1 to 19
2 to 22
3 B 29
4 B 15
5 C 32
6 C 39
7 C 14

Wir können Spalten auch mithilfe von Indexwerten ausschließen

 #exclude column 2
df[, c(-2)]

  team assists
1 to 19
2 to 22
3 B 29
4 B 15
5 C 32
6 C 39
7 C 14

Beispiel 3: Teilmenge des Datenrahmens durch Auswahl von Zeilen

Der folgende Code zeigt, wie man einen Datenrahmen nach bestimmten Zeilen unterteilt:

 #select rows 1, 5, and 7
df[c(1, 5, 7), ]

  team points assists
1 A 77 19
5 C 99 32
7 C 97 14

Wir können einen Datenrahmen auch unterteilen, indem wir einen Zeilenbereich auswählen:

 #select rows 1 through 5
df[1:5, ]

  team points assists
1 A 77 19
2 A 81 22
3 B 89 29
4 B 83 15
5 C 99 32

Beispiel 4: Teilmengendatenrahmen basierend auf Bedingungen

Der folgende Code zeigt, wie Sie mit der Funktion subset() Zeilen und Spalten auswählen, die bestimmte Bedingungen erfüllen:

 #select rows where points is greater than 90
subset(df, points > 90)

  team points assists
5 C 99 32
6 C 92 39
7 C 97 14

Wir können auch das | verwenden Operator („oder“) zur Auswahl von Zeilen, die eine der folgenden Bedingungen erfüllen:

 #select rows where points is greater than 90 or less than 80
subset(df, points > 90 | points < 80)

  team points assists
1 A 77 19
5 C 99 32
6 C 92 39
7 C 97 14

Wir können auch den Operator & („und“) verwenden, um Zeilen auszuwählen, die mehrere Bedingungen erfüllen:

 #select rows where points is greater than 90 and assists is greater than 30
subset(df, points > 90 & assists > 30)

  team points assists
5 C 99 32
6 C 92 39

Wir können das Argument select auch verwenden, um basierend auf einer Bedingung nur bestimmte Spalten auszuwählen:

 #select rows where points is greater than 90 and only show 'team' column
subset(df, points > 90, select=c(' team '))

  team
5C
6C
7C

Zusätzliche Ressourcen

So entfernen Sie Zeilen basierend auf der Bedingung aus dem Datenrahmen in R
So ersetzen Sie Werte im Datenrahmen in R
So entfernen Sie Spalten aus dem Datenrahmen in R

Über den Autor

Dr. Benjamin Anderson

Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu befähigen. Mehr wissen