Come estrarre l'anno dalla data in r (con esempi)
Esistono due modi per estrarre rapidamente l’anno da una data in R:
Metodo 1: utilizzare format()
df$year <- format( as.Date (df$date, format=" %d/%m/%Y ")," %Y ")
Metodo 2: utilizzare il pacchetto di lubrificazione
library (lubridate) df$year <- year( mdy (df$date))
Questo tutorial mostra un esempio di come utilizzare ciascuno di questi metodi nella pratica.
Metodo 1: estrai l’anno dalla data utilizzando format()
Il codice seguente mostra come estrarre l’anno da una data utilizzando la funzione format() combinata con l’argomento “%Y” :
#create data frame df <- data.frame(date=c("01/01/2021", "01/04/2021" , "01/09/2021"), sales=c(34, 36, 44)) #view data frame df dirty dates 1 01/01/2021 34 2 01/04/2021 36 3 01/09/2021 44 #create new variable that contains year df$year <- format( as.Date (df$date, format=" %d/%m/%Y ")," %Y ") #view new data frame df date sales year 1 01/01/2021 34 2021 2 01/04/2021 36 2021 3 01/09/2021 44 2021
Tieni presente che questa funzione format() funziona con una varietà di formati di data. Devi semplicemente specificare il formato:
#create data frame df <- data.frame(date=c("2021-01-01", "2021-01-04", "2021-01-09"), sales=c(34, 36, 44)) #view data frame df dirty date 1 2021-01-01 34 2 2021-01-04 36 3 2021-01-09 44 #create new variable that contains year df$year <- format( as.Date (df$date, format=" %Y-%m-%d ")," %Y ") #view new data frame df date sales year 1 01/01/2021 34 2021 2 01/04/2021 36 2021 3 01/09/2021 44 2021
Metodo 2: estrarre l’anno dalla data utilizzando Lubridate
Possiamo anche utilizzare le funzioni del pacchetto lubrificanti per estrarre rapidamente l’anno da una data:
library (lubridate) #create data frame df <- data.frame(date=c("01/01/2021", "01/04/2021" , "01/09/2021"), sales=c(34, 36, 44)) #view data frame df dirty dates 1 01/01/2021 34 2 01/04/2021 36 3 01/09/2021 44 #create new variable that contains year df$year <- year( mdy (df$date)) #view new data frame df date sales year 1 01/01/2021 34 2021 2 01/04/2021 36 2021 3 01/09/2021 44 2021
Lubridate funziona anche con una varietà di formati di data. Devi semplicemente specificare il formato:
#create data frame df <- data.frame(date=c("2021-01-01", "2021-01-04", "2021-01-09"), sales=c(34, 36, 44)) #view data frame df dirty dates 1 2021-01-01 34 2 2021-01-04 36 3 2021-01-09 44 #create new variable that contains year df$year <- year( ymd (df$date)) #view new data frame df date sales year 1 01/01/2021 34 2021 2 01/04/2021 36 2021 3 01/09/2021 44 2021
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre operazioni comuni in R:
Come scorrere i nomi delle colonne in R
Come rimuovere i valori anomali da più colonne in R