Как извлечь год из даты в r (с примерами)
Есть два способа быстро извлечь год из даты в R:
Способ 1: используйте формат()
df$year <- format( as.Date (df$date, format=" %d/%m/%Y ")," %Y ")
Способ 2. Используйте пакет смазки.
library (lubridate) df$year <- year( mdy (df$date))
В этом руководстве показан пример использования каждого из этих методов на практике.
Метод 1: извлечь год из даты с помощью format()
Следующий код показывает, как извлечь год из даты с помощью функции format() в сочетании с аргументом «%Y» :
#create data frame df <- data.frame(date=c("01/01/2021", "01/04/2021" , "01/09/2021"), sales=c(34, 36, 44)) #view data frame df dirty dates 1 01/01/2021 34 2 01/04/2021 36 3 01/09/2021 44 #create new variable that contains year df$year <- format( as.Date (df$date, format=" %d/%m/%Y ")," %Y ") #view new data frame df date sales year 1 01/01/2021 34 2021 2 01/04/2021 36 2021 3 01/09/2021 44 2021
Обратите внимание, что эта функция format() работает с различными форматами дат. Вам просто нужно указать формат:
#create data frame df <- data.frame(date=c("2021-01-01", "2021-01-04", "2021-01-09"), sales=c(34, 36, 44)) #view data frame df dirty date 1 2021-01-01 34 2 2021-01-04 36 3 2021-01-09 44 #create new variable that contains year df$year <- format( as.Date (df$date, format=" %Y-%m-%d ")," %Y ") #view new data frame df date sales year 1 01/01/2021 34 2021 2 01/04/2021 36 2021 3 01/09/2021 44 2021
Метод 2. Извлеките год из даты с помощью Lubridate.
Мы также можем использовать функции пакета lubridate, чтобы быстро извлечь год из даты:
library (lubridate) #create data frame df <- data.frame(date=c("01/01/2021", "01/04/2021" , "01/09/2021"), sales=c(34, 36, 44)) #view data frame df dirty dates 1 01/01/2021 34 2 01/04/2021 36 3 01/09/2021 44 #create new variable that contains year df$year <- year( mdy (df$date)) #view new data frame df date sales year 1 01/01/2021 34 2021 2 01/04/2021 36 2021 3 01/09/2021 44 2021
Lubridate также работает с различными форматами дат. Вам просто нужно указать формат:
#create data frame df <- data.frame(date=c("2021-01-01", "2021-01-04", "2021-01-09"), sales=c(34, 36, 44)) #view data frame df dirty dates 1 2021-01-01 34 2 2021-01-04 36 3 2021-01-09 44 #create new variable that contains year df$year <- year( ymd (df$date)) #view new data frame df date sales year 1 01/01/2021 34 2021 2 01/04/2021 36 2021 3 01/09/2021 44 2021
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные операции в R:
Как перебирать имена столбцов в R
Как удалить выбросы из нескольких столбцов в R