Pandas で timedelta を int に変換する方法 (例あり)
次のメソッドを使用して、pandas DataFrame の timedelta 列を整数列に変換できます。
方法 1: Timedelta を整数 (日) に変換する
df[' days '] = df[' timedelta_column ']. dt . days
方法 2: Timedelta を整数 (時間) に変換する
df[' hours '] = df[' timedelta_column '] / pd. Timedelta (hours= 1 )
方法 3: Timedelta を整数 (分) に変換する
df[' minutes '] = df[' timedelta_column '] / pd. Timedelta (minutes= 1 )
次の例は、次の pandas DataFrame で各メソッドを実際に使用する方法を示しています。
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' promotion ': ['A', 'B', 'C', 'D'],
' start ': ['2021-10-04 13:29:00', '2021-10-07 12:30:00',
'2021-10-15 04:20:00', '2021-10-18 15:45:03'],
' end ': ['2021-10-08 11:29:06', '2021-10-15 10:30:07',
'2021-10-29 05:50:15', '2021-10-22 15:40:03']})
#convert start date and end date columns to datetime
df[' start '] = pd. to_datetime (df[' start '])
df[' end '] = pd. to_datetime (df[' end '])
#create new column that contains time delta between start and end
df[' duration '] = df[' end '] - df[' start ']
#view DataFrame
print (df)
promotion start end duration
0 A 2021-10-04 13:29:00 2021-10-08 11:29:06 3 days 22:00:06
1 B 2021-10-07 12:30:00 2021-10-15 10:30:07 7 days 22:00:07
2 C 2021-10-15 04:20:00 2021-10-29 05:50:15 14 days 01:30:15
3 D 2021-10-18 15:45:03 2021-10-22 15:40:03 3 days 23:55:00
例 1: Timedelta を整数 (日) に変換する
次のコードは、 duration列の timedelta を timedelta 列の日数を表す整数値に変換するdaysという新しい列を作成する方法を示しています。
#create new column that converts timedelta into integer number of days
df[' days '] = df[' duration ']. dt . days
#view updated DataFrame
print (df)
promotion start end duration days
0 A 2021-10-04 13:29:00 2021-10-08 11:29:06 3 days 22:00:06 3
1 B 2021-10-07 12:30:00 2021-10-15 10:30:07 7 days 22:00:07 7
2 C 2021-10-15 04:20:00 2021-10-29 05:50:15 14 days 01:30:15 14
3 D 2021-10-18 15:45:03 2021-10-22 15:40:03 3 days 23:55:00 3
dtypeを使用して、この新しい列のデータ型を確認できます。
#check data type
df. days . dtype
dtype('int64')
新しい列は整数です。
例 2: Timedelta を整数 (時間) に変換する
次のコードは、 duration列の timedelta を timedelta 列の合計時間数を表す数値に変換する、hours という新しい列を作成する方法を示しています。
#create new column that converts timedelta into total number of hours
df[' hours '] = df[' duration '] / pd. Timedelta (hours= 1 )
#view updated DataFrame
print (df)
promotion start end duration hours
0 A 2021-10-04 13:29:00 2021-10-08 11:29:06 3 days 22:00:06 94.001667
1 B 2021-10-07 12:30:00 2021-10-15 10:30:07 7 days 22:00:07 190.001944
2 C 2021-10-15 04:20:00 2021-10-29 05:50:15 14 days 01:30:15 337.504167
3 D 2021-10-18 15:45:03 2021-10-22 15:40:03 3 days 23:55:00 95.916667
dtypeを使用して、この新しい列のデータ型を確認できます。
#check data type
df. hours . dtype
dtype('float64')
新しい列は浮動小数点数です。
例 3: Timedelta を整数 (分) に変換する
次のコードは、 duration列の timedelta を timedelta 列の合計分数を表す数値に変換するminutesという新しい列を作成する方法を示しています。
#create new column that converts timedelta into total number of minutes
df[' minutes '] = df[' duration '] / pd. Timedelta (minutes= 1 )
#view updated DataFrame
print (df)
promotion start end duration minutes
0 A 2021-10-04 13:29:00 2021-10-08 11:29:06 3 days 22:00:06 5640.100000
1 B 2021-10-07 12:30:00 2021-10-15 10:30:07 7 days 22:00:07 11400.116667
2 C 2021-10-15 04:20:00 2021-10-29 05:50:15 14 days 01:30:15 20250.250000
3 D 2021-10-18 15:45:03 2021-10-22 15:40:03 3 days 23:55:00 5755.000000
dtypeを使用して、この新しい列のデータ型を確認できます。
#check datatype
df. minutes . dtype
dtype('float64')
新しい列は浮動小数点数です。
追加リソース
次のチュートリアルでは、パンダで他の一般的なタスクを実行する方法を説明します。
Pandas で列を DateTime に変換する方法
Pandas で DateTime を日付に変換する方法
Pandasで日付から月を抽出する方法