Як отримати рік із дати в r (з прикладами)


Є два способи швидко витягти рік із дати в R:

Спосіб 1: Використовуйте format()

 df$year <- format( as.Date (df$date, format=" %d/%m/%Y ")," %Y ")

Спосіб 2: Використовуйте пакет мастила

 library (lubridate)

df$year <- year( mdy (df$date))

Цей підручник демонструє приклад використання кожного з цих методів на практиці.

Спосіб 1: вилучення року з дати за допомогою format()

У наведеному нижче коді показано, як отримати рік із дати за допомогою функції format() у поєднанні з аргументом “%Y” :

 #create data frame
df <- data.frame(date=c("01/01/2021", "01/04/2021" , "01/09/2021"),
                  sales=c(34, 36, 44))

#view data frame
df

        dirty dates
1 01/01/2021 34
2 01/04/2021 36
3 01/09/2021 44

#create new variable that contains year
df$year <- format( as.Date (df$date, format=" %d/%m/%Y ")," %Y ")

#view new data frame
df

        date sales year
1 01/01/2021 34 2021
2 01/04/2021 36 2021
3 01/09/2021 44 2021

Зауважте, що ця функція format() працює з різними форматами дати. Вам просто потрібно вказати формат:

 #create data frame
df <- data.frame(date=c("2021-01-01", "2021-01-04", "2021-01-09"),
                  sales=c(34, 36, 44))

#view data frame
df

        dirty date
1 2021-01-01 34
2 2021-01-04 36
3 2021-01-09 44

#create new variable that contains year
df$year <- format( as.Date (df$date, format=" %Y-%m-%d ")," %Y ")

#view new data frame
df

        date sales year
1 01/01/2021 34 2021
2 01/04/2021 36 2021
3 01/09/2021 44 2021

Спосіб 2: вилучення року з дати за допомогою Lubridate

Ми також можемо використовувати функції в пакеті lubridate, щоб швидко витягти рік із дати:

 library (lubridate)

#create data frame
df <- data.frame(date=c("01/01/2021", "01/04/2021" , "01/09/2021"),
                  sales=c(34, 36, 44))

#view data frame
df

        dirty dates
1 01/01/2021 34
2 01/04/2021 36
3 01/09/2021 44

#create new variable that contains year
df$year <- year( mdy (df$date))

#view new data frame
df

        date sales year
1 01/01/2021 34 2021
2 01/04/2021 36 2021
3 01/09/2021 44 2021

Lubridate також працює з різними форматами дати. Вам просто потрібно вказати формат:

 #create data frame
df <- data.frame(date=c("2021-01-01", "2021-01-04", "2021-01-09"),
                  sales=c(34, 36, 44))

#view data frame
df

        dirty dates
1 2021-01-01 34
2 2021-01-04 36
3 2021-01-09 44

#create new variable that contains year
df$year <- year( ymd (df$date))

#view new data frame
df

        date sales year
1 01/01/2021 34 2021
2 01/04/2021 36 2021
3 01/09/2021 44 2021

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові операції в R:

Як перебирати імена стовпців у R
Як видалити викиди з кількох стовпців у R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *