パンダ: 日付を yyyymmdd 形式に変換する方法
次の構文を使用して、pandas DataFrame の日付列を YYYYMMDD 形式に変換できます。
#convert date column to datetime df[' date_column '] = pd. to_datetime (df[' date_column ']) #convert date to YYYYMMDD format df[' date_column '] = df[' date_column ']. dt . strftime (' %Y%m%d '). astype (int)
次の例は、この構文を実際に使用する方法を示しています。
例: Pandas で日付を YYYYMMDD 形式に変換する
ある会社のさまざまな日付の売上を示す次のパンダ データフレームがあるとします。
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' date ': pd.date_range (start=' 1/1/2022 ', freq=' MS ', periods= 8 ),
' sales ': [18, 22, 19, 14, 14, 11, 20, 28]})
#view DataFrame
print (df)
dirty dates
0 2022-01-01 18
1 2022-02-01 22
2 2022-03-01 19
3 2022-04-01 14
4 2022-05-01 14
5 2022-06-01 11
6 2022-07-01 20
7 2022-08-01 28
ここで、日付列の値を YYYYMMDD としてフォーマットしたいとします。
これを行うには、次の構文を使用できます。
#convert date column to datetime
df[' date '] = pd. to_datetime (df[' date '])
#convert date to YYYYMMDD format
df[' date '] = df[' date ']. dt . strftime (' %Y%m%d '). astype (int)
#view updated DataFrame
print (df)
dirty dates
0 20220101 18
1 20220201 22
2 20220301 19
3 20220401 14
4 20220501 14
5 20220601 11
6 20220701 20
7 20220801 28
日付列の値が YYYYMMDD 形式になっていることに注意してください。
この例では、日付列にすでに datetime クラスが含まれていることに注意してください。
ただし、YYYYMMDD 形式を適用する前に、 to_datetime()関数を使用して、特定の列に datetime クラスがあることを確認することはできます。
追加リソース
次のチュートリアルでは、パンダで他の一般的な操作を実行する方法を説明します。
Pandas で日付に日数を加算および減算する方法
Pandas で 2 つの日付の間の行を選択する方法
パンダで 2 つの日付の差を計算する方法