Jak wyodrębnić rok z daty w r (z przykładami)


Istnieją dwa sposoby szybkiego wyodrębnienia roku z daty w R:

Metoda 1: Użyj formatu()

 df$year <- format( as.Date (df$date, format=" %d/%m/%Y ")," %Y ")

Metoda 2: Użyj pakietu smarowania

 library (lubridate)

df$year <- year( mdy (df$date))

W tym samouczku przedstawiono przykład wykorzystania każdej z tych metod w praktyce.

Metoda 1: Wyodrębnij rok z daty za pomocą format()

Poniższy kod pokazuje, jak wyodrębnić rok z daty za pomocą funkcji format() połączonej z argumentem „%Y” :

 #create data frame
df <- data.frame(date=c("01/01/2021", "01/04/2021" , "01/09/2021"),
                  sales=c(34, 36, 44))

#view data frame
df

        dirty dates
1 01/01/2021 34
2 01/04/2021 36
3 01/09/2021 44

#create new variable that contains year
df$year <- format( as.Date (df$date, format=" %d/%m/%Y ")," %Y ")

#view new data frame
df

        date sales year
1 01/01/2021 34 2021
2 01/04/2021 36 2021
3 01/09/2021 44 2021

Należy pamiętać, że ta funkcja format() działa z różnymi formatami dat. Wystarczy określić format:

 #create data frame
df <- data.frame(date=c("2021-01-01", "2021-01-04", "2021-01-09"),
                  sales=c(34, 36, 44))

#view data frame
df

        dirty date
1 2021-01-01 34
2 2021-01-04 36
3 2021-01-09 44

#create new variable that contains year
df$year <- format( as.Date (df$date, format=" %Y-%m-%d ")," %Y ")

#view new data frame
df

        date sales year
1 01/01/2021 34 2021
2 01/04/2021 36 2021
3 01/09/2021 44 2021

Metoda 2: Wyodrębnij rok z daty za pomocą Lubridate

Możemy również użyć funkcji pakietu lubridate, aby szybko wyodrębnić rok z daty:

 library (lubridate)

#create data frame
df <- data.frame(date=c("01/01/2021", "01/04/2021" , "01/09/2021"),
                  sales=c(34, 36, 44))

#view data frame
df

        dirty dates
1 01/01/2021 34
2 01/04/2021 36
3 01/09/2021 44

#create new variable that contains year
df$year <- year( mdy (df$date))

#view new data frame
df

        date sales year
1 01/01/2021 34 2021
2 01/04/2021 36 2021
3 01/09/2021 44 2021

Lubridate działa również z różnymi formatami daty. Wystarczy określić format:

 #create data frame
df <- data.frame(date=c("2021-01-01", "2021-01-04", "2021-01-09"),
                  sales=c(34, 36, 44))

#view data frame
df

        dirty dates
1 2021-01-01 34
2 2021-01-04 36
3 2021-01-09 44

#create new variable that contains year
df$year <- year( ymd (df$date))

#view new data frame
df

        date sales year
1 01/01/2021 34 2021
2 01/04/2021 36 2021
3 01/09/2021 44 2021

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje w języku R:

Jak iterować po nazwach kolumn w R
Jak usunąć wartości odstające z wielu kolumn w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *