Pandas: як розрахувати дельту часу в місяцях
Ви можете використовувати таку функцію, щоб обчислити дельту часу в місяцях між двома стовпцями pandas DataFrame:
def month_diff(x, y): end = x. dt . to_period (' M '). view (dtype=' int64 ') start = y. dt . to_period (' M '). view (dtype=' int64 ') return end-start
У наступному прикладі показано, як використовувати цю функцію на практиці.
Приклад: обчислення дельти часу в місяцях у Pandas
Припустімо, що у нас є наступні pandas DataFrame:
import pandas as pd #createDataFrame df = pd. DataFrame ({' event ': ['A', 'B', 'C'], ' start_date ': ['20210101', '20210201', '20210401'], ' end_date ': ['20210608', '20210209', '20210801'] }) #convert start date and end date columns to datetime df[' start_date '] = pd. to_datetime (df[' start_date ']) df[' end_date '] = pd. to_datetime (df[' end_date ']) #view DataFrame print (df) event start_date end_date 0 A 2021-01-01 2021-06-08 1 B 2021-02-01 2021-02-09 2 C 2021-04-01 2021-08-01
Тепер припустімо, що ми хочемо обчислити дельту часу (у місяцях) між стовпцями start_date і end_date .
Для цього ми спочатку визначимо таку функцію:
#define function to calculate time delta in months between two columns def month_diff(x, y): end = x. dt . to_period (' M '). view (dtype=' int64 ') start = y. dt . to_period (' M '). view (dtype=' int64 ') return end-start
Далі ми використаємо цю функцію для обчислення дельти часу в місяцях між стовпцями start_date і end_date :
#calculate month difference between start date and end date columns
df[' month_difference '] = month_diff(df. end_date , df. start_date )
#view updated DataFrame
df
event start_date end_date month_difference
0 A 2021-01-01 2021-06-08 5
1 B 2021-02-01 2021-02-09 0
2 C 2021-04-01 2021-08-01 4
У стовпці Month_difference відображається різниця часу (у місяцях) між стовпцями start_date і end_date .
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові операції в pandas:
Як перетворити стовпці на DateTime у Pandas
Як перетворити DateTime на дату в Pandas
Як витягти місяць із дати в Pandas