Pandas: como converter a data para o formato aaaammdd
Você pode usar a seguinte sintaxe para converter uma coluna de data em um DataFrame do pandas para o formato AAAAMMDD:
#convert date column to datetime df[' date_column '] = pd. to_datetime (df[' date_column ']) #convert date to YYYYMMDD format df[' date_column '] = df[' date_column ']. dt . strftime (' %Y%m%d '). astype (int)
O exemplo a seguir mostra como usar essa sintaxe na prática.
Exemplo: converter a data para o formato AAAAMMDD no Pandas
Digamos que temos o seguinte DataFrame do pandas que mostra as vendas realizadas por uma empresa em datas diferentes:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' date ': pd.date_range (start=' 1/1/2022 ', freq=' MS ', periods= 8 ),
' sales ': [18, 22, 19, 14, 14, 11, 20, 28]})
#view DataFrame
print (df)
dirty dates
0 2022-01-01 18
1 2022-02-01 22
2 2022-03-01 19
3 2022-04-01 14
4 2022-05-01 14
5 2022-06-01 11
6 2022-07-01 20
7 2022-08-01 28
Agora suponha que queiramos formatar os valores da coluna de data como AAAAMMDD.
Podemos usar a seguinte sintaxe para fazer isso:
#convert date column to datetime
df[' date '] = pd. to_datetime (df[' date '])
#convert date to YYYYMMDD format
df[' date '] = df[' date ']. dt . strftime (' %Y%m%d '). astype (int)
#view updated DataFrame
print (df)
dirty dates
0 20220101 18
1 20220201 22
2 20220301 19
3 20220401 14
4 20220501 14
5 20220601 11
6 20220701 20
7 20220801 28
Observe que os valores da coluna de data agora estão no formato AAAAMMDD.
Observe que neste exemplo, a coluna de data já possuía uma classe datetime.
No entanto, ainda podemos usar a função to_datetime() para garantir que uma determinada coluna tenha uma classe de data e hora antes de aplicar um formato AAAAMMDD.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras operações comuns em pandas:
Como adicionar e subtrair dias de uma data no Pandas
Como selecionar linhas entre duas datas no Pandas
Como calcular a diferença entre duas datas em pandas