Pandas: como obter um trimestre a partir da data
Você pode usar os seguintes métodos para obter o trimestre de uma data em um DataFrame do pandas:
Método 1: obter o trimestre a partir da data (formato de ano e trimestre)
df[' quarter '] = pd. PeriodIndex ( df.date , freq=' Q ')
Se a data for no primeiro trimestre de 2022, o trimestre será retornado em um formato como 2022T1 .
Método 2: obter o trimestre a partir da data (formato de número do trimestre)
df[' quarter '] = df[' date ']. dt . quarter
Se a data for no primeiro trimestre de 2022, isso simplesmente retornará o valor 1 .
Os exemplos a seguir mostram como usar essa sintaxe na prática com o seguinte DataFrame do pandas:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' date ': pd.date_range (start=' 1/1/2022 ', freq=' M ', periods= 14 ),
' sales ': [6, 8, 10, 5, 4, 8, 8, 3, 5, 14, 8, 3, 10, 12]})
#view DataFrame
print (df)
dirty date
0 2022-01-31 6
1 2022-02-28 8
2 2022-03-31 10
3 2022-04-30 5
4 2022-05-31 4
5 2022-06-30 8
6 2022-07-31 8
7 2022-08-31 3
8 2022-09-30 5
9 2022-10-31 14
10 2022-11-30 8
11 2022-12-31 3
12 2023-01-31 10
13 2023-02-28 12
Exemplo 1: Obtenha o trimestre a partir da data (formato de ano e trimestre)
Podemos usar o código a seguir para criar uma nova coluna chamada trimestre que extrai o trimestre da coluna de data no formato de ano e trimestre:
#create new column that displays year and quarter from date column
df[' quarter '] = pd. PeriodIndex ( df.date , freq=' Q ')
#view updated DataFrame
print (df)
date sales quarter
0 2022-01-31 6 2022Q1
1 2022-02-28 8 2022Q1
2 2022-03-31 10 2022Q1
3 2022-04-30 5 2022Q2
4 2022-05-31 4 2022Q2
5 2022-06-30 8 2022Q2
6 2022-07-31 8 2022Q3
7 2022-08-31 3 2022Q3
8 2022-09-30 5 2022Q3
9 2022-10-31 14 2022Q4
10 2022-11-30 8 2022Q4
11 2022-12-31 3 2022Q4
12 2023-01-31 10 2023Q1
13 2023-02-28 12 2023Q1
A nova coluna denominada trimestre contém o trimestre da coluna de data no formato de ano e trimestre.
Exemplo 2: obter o trimestre a partir da data (formato do número do trimestre)
Podemos usar o código a seguir para criar uma nova coluna chamada trimestre que extrai o trimestre da coluna de data no formato numérico do trimestre.
#create new column that displays quarter from date column
df[' quarter '] = df[' date ']. dt . quarter
#view updated DataFrame
print (df)
date sales quarter
0 2022-01-31 6 1
1 2022-02-28 8 1
2 2022-03-31 10 1
3 2022-04-30 5 2
4 2022-05-31 4 2
5 2022-06-30 8 2
6 2022-07-31 8 3
7 2022-08-31 3 3
8 2022-09-30 5 3
9 2022-10-31 14 4
10 2022-11-30 8 4
11 2022-12-31 3 4
12 2023-01-31 10 1
13 2023-02-28 12 1
A nova coluna chamada trimestre contém o número do trimestre da coluna de data em formato de número de trimestre.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:
Como adicionar e subtrair dias de uma data no Pandas
Como selecionar linhas entre duas datas no Pandas
Como criar uma coluna de data de ano, mês e dia no Pandas