Jak używać oddzielnej funkcji w r (z przykładami)


Funkcji Separate() pakietu Tidyr można użyć do rozdzielenia kolumny ramki danych na wiele kolumn.

Ta funkcja wykorzystuje następującą podstawową składnię:

rozdzielone (dane, kol., w, wrz)

Złoto:

  • dane : Nazwa ramki danych
  • col : Nazwa kolumny do oddzielenia
  • in : wektor nazw kolumny, na którą ma zostać rozdzielona
  • sep : Wartość, przy której ma zostać oddzielona kolumna

Poniższe przykłady pokazują, jak w praktyce wykorzystać tę funkcję.

Przykład 1: podziel kolumnę na dwie kolumny

Załóżmy, że mamy następującą ramkę danych w R:

 #create data frame
df <- data. frame (player=c('A', 'A', 'B', 'B', 'C', 'C'),
                 year=c(1, 2, 1, 2, 1, 2),
                 stats=c('22-2', '29-3', '18-6', '11-8', '12-5', '19-2'))

#view data frame
df

  player year stats
1 A 1 22-2
2 A 2 29-3
3 B 1 18-6
4 B 2 11-8
5 C 1 12-5
6 C 2 19-2

Możemy użyć funkcji Separate() , aby podzielić kolumnę statystyk na dwie nowe kolumny zwane „punktami” i „asystami” w następujący sposób:

 library (tidyr)

#separate stats column into points and assists columns
separate(df, col=stats, into=c(' points ', ' assists '), sep=' - ')

  player year points assists
1 A 1 22 2
2 A 2 29 3
3 B 1 18 6
4 B 2 11 8
5 C 1 12 5
6 C 2 19 2

Przykład 2: Podziel kolumnę na więcej niż dwie kolumny

Załóżmy, że mamy następującą ramkę danych w R:

 #create data frame
df2 <- data. frame (player=c('A', 'A', 'B', 'B', 'C', 'C'),
                 year=c(1, 2, 1, 2, 1, 2),
                 stats=c('22/2/3', '29/3/4', '18/6/7', '11/1/2', '12/1/1', '19/2/4 '))

#view data frame
df2

  player year stats
1 A 1 22/2/3
2 A 2 29/3/4
3 B 1 18/6/7
4 B 2 11/1/2
5 C 1 12/1/1
6 C 2 19/2/4

Możemy użyć funkcji Separate() , aby podzielić kolumnę statystyk na trzy oddzielne kolumny:

 library (tidyr)

#separate stats column into three new columns
separate(df, col=stats, into=c(' points ', ' assists ', ' steals '), sep=' / ')

  player year points assists steals
1 A 1 22 2 3
2 A 2 29 3 4
3 B 1 18 6 7
4 B 2 11 1 2
5 C 1 12 1 1
6 C 2 19 2 4

Dodatkowe zasoby

Celem pakietu Tidyr jest tworzenie „uporządkowanych” danych, które charakteryzują się następującymi cechami:

  • Każda kolumna jest zmienną.
  • Każda linia jest obserwacją.
  • Każda komórka ma unikalną wartość.

Pakiet Tidyr wykorzystuje cztery główne funkcje do tworzenia uporządkowanych danych:

1. Funkcja spread() .

2. Funkcja zbierania() .

3. Funkcja oddzielna() .

4. Funkcja unit() .

Jeśli opanujesz te cztery funkcje, będziesz w stanie stworzyć „porządne” dane z dowolnej ramki danych.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *