Come estrarre l'anno dalla data in r (con esempi)


Esistono due modi per estrarre rapidamente l’anno da una data in R:

Metodo 1: utilizzare format()

 df$year <- format( as.Date (df$date, format=" %d/%m/%Y ")," %Y ")

Metodo 2: utilizzare il pacchetto di lubrificazione

 library (lubridate)

df$year <- year( mdy (df$date))

Questo tutorial mostra un esempio di come utilizzare ciascuno di questi metodi nella pratica.

Metodo 1: estrai l’anno dalla data utilizzando format()

Il codice seguente mostra come estrarre l’anno da una data utilizzando la funzione format() combinata con l’argomento “%Y” :

 #create data frame
df <- data.frame(date=c("01/01/2021", "01/04/2021" , "01/09/2021"),
                  sales=c(34, 36, 44))

#view data frame
df

        dirty dates
1 01/01/2021 34
2 01/04/2021 36
3 01/09/2021 44

#create new variable that contains year
df$year <- format( as.Date (df$date, format=" %d/%m/%Y ")," %Y ")

#view new data frame
df

        date sales year
1 01/01/2021 34 2021
2 01/04/2021 36 2021
3 01/09/2021 44 2021

Tieni presente che questa funzione format() funziona con una varietà di formati di data. Devi semplicemente specificare il formato:

 #create data frame
df <- data.frame(date=c("2021-01-01", "2021-01-04", "2021-01-09"),
                  sales=c(34, 36, 44))

#view data frame
df

        dirty date
1 2021-01-01 34
2 2021-01-04 36
3 2021-01-09 44

#create new variable that contains year
df$year <- format( as.Date (df$date, format=" %Y-%m-%d ")," %Y ")

#view new data frame
df

        date sales year
1 01/01/2021 34 2021
2 01/04/2021 36 2021
3 01/09/2021 44 2021

Metodo 2: estrarre l’anno dalla data utilizzando Lubridate

Possiamo anche utilizzare le funzioni del pacchetto lubrificanti per estrarre rapidamente l’anno da una data:

 library (lubridate)

#create data frame
df <- data.frame(date=c("01/01/2021", "01/04/2021" , "01/09/2021"),
                  sales=c(34, 36, 44))

#view data frame
df

        dirty dates
1 01/01/2021 34
2 01/04/2021 36
3 01/09/2021 44

#create new variable that contains year
df$year <- year( mdy (df$date))

#view new data frame
df

        date sales year
1 01/01/2021 34 2021
2 01/04/2021 36 2021
3 01/09/2021 44 2021

Lubridate funziona anche con una varietà di formati di data. Devi semplicemente specificare il formato:

 #create data frame
df <- data.frame(date=c("2021-01-01", "2021-01-04", "2021-01-09"),
                  sales=c(34, 36, 44))

#view data frame
df

        dirty dates
1 2021-01-01 34
2 2021-01-04 36
3 2021-01-09 44

#create new variable that contains year
df$year <- year( ymd (df$date))

#view new data frame
df

        date sales year
1 01/01/2021 34 2021
2 01/04/2021 36 2021
3 01/09/2021 44 2021

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre operazioni comuni in R:

Come scorrere i nomi delle colonne in R
Come rimuovere i valori anomali da più colonne in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *