Pandas'ta timedelta'yı int'ye dönüştürme (örneklerle)


Pandas DataFrame’de bir timedelta sütununu bir tam sayı sütununa dönüştürmek için aşağıdaki yöntemleri kullanabilirsiniz:

Yöntem 1: Timedelta’yı Tamsayıya (Gün) Dönüştür

 df[' days '] = df[' timedelta_column ']. dt . days

Yöntem 2: Timedelta’yı Tamsayıya (Saat) Dönüştür

 df[' hours '] = df[' timedelta_column '] / pd. Timedelta (hours= 1 )

Yöntem 3: Timedelta’yı Tam Sayıya Dönüştür (Dakika)

 df[' minutes '] = df[' timedelta_column '] / pd. Timedelta (minutes= 1 )

Aşağıdaki örnek, her yöntemin aşağıdaki pandalar DataFrame ile pratikte nasıl kullanılacağını gösterir:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' promotion ': ['A', 'B', 'C', 'D'],
                   ' start ': ['2021-10-04 13:29:00', '2021-10-07 12:30:00',
                             '2021-10-15 04:20:00', '2021-10-18 15:45:03'],
                   ' end ': ['2021-10-08 11:29:06', '2021-10-15 10:30:07',
                             '2021-10-29 05:50:15', '2021-10-22 15:40:03']})

#convert start date and end date columns to datetime
df[' start '] = pd. to_datetime (df[' start '])
df[' end '] = pd. to_datetime (df[' end '])

#create new column that contains time delta between start and end
df[' duration '] = df[' end '] - df[' start ']

#view DataFrame
print (df)

  promotion start end duration
0 A 2021-10-04 13:29:00 2021-10-08 11:29:06 3 days 22:00:06
1 B 2021-10-07 12:30:00 2021-10-15 10:30:07 7 days 22:00:07
2 C 2021-10-15 04:20:00 2021-10-29 05:50:15 14 days 01:30:15
3 D 2021-10-18 15:45:03 2021-10-22 15:40:03 3 days 23:55:00

Örnek 1: Timedelta’yı tam sayıya (gün) dönüştürün

Aşağıdaki kod, süre sütunundaki timedelta’yı timedelta sütunundaki gün sayısını temsil eden bir tamsayı değerine dönüştüren, gün adı verilen yeni bir sütunun nasıl oluşturulacağını gösterir.

 #create new column that converts timedelta into integer number of days
df[' days '] = df[' duration ']. dt . days

#view updated DataFrame
print (df)

  promotion start end duration days
0 A 2021-10-04 13:29:00 2021-10-08 11:29:06 3 days 22:00:06 3
1 B 2021-10-07 12:30:00 2021-10-15 10:30:07 7 days 22:00:07 7
2 C 2021-10-15 04:20:00 2021-10-29 05:50:15 14 days 01:30:15 14
3 D 2021-10-18 15:45:03 2021-10-22 15:40:03 3 days 23:55:00 3

Bu yeni sütunun veri türünü kontrol etmek için dtype’ı kullanabiliriz:

 #check data type
df. days . dtype

dtype('int64')

Yeni sütun bir tamsayıdır.

Örnek 2: Timedelta’yı tamsayıya (saat) dönüştürün

Aşağıdaki kod, süre sütunundaki zaman deltasını, zaman deltası sütunundaki toplam saat sayısını temsil eden sayısal bir değere dönüştüren, saat adı verilen yeni bir sütunun nasıl oluşturulacağını gösterir.

 #create new column that converts timedelta into total number of hours
df[' hours '] = df[' duration '] / pd. Timedelta (hours= 1 )

#view updated DataFrame
print (df)

  promotion start end duration hours
0 A 2021-10-04 13:29:00 2021-10-08 11:29:06 3 days 22:00:06 94.001667  
1 B 2021-10-07 12:30:00 2021-10-15 10:30:07 7 days 22:00:07 190.001944
2 C 2021-10-15 04:20:00 2021-10-29 05:50:15 14 days 01:30:15 337.504167
3 D 2021-10-18 15:45:03 2021-10-22 15:40:03 3 days 23:55:00 95.916667

Bu yeni sütunun veri türünü kontrol etmek için dtype’ı kullanabiliriz:

 #check data type
df. hours . dtype

dtype('float64')

Yeni sütun bir kayan noktadır.

Örnek 3: Timedelta’yı tamsayıya (dakika) dönüştürün

Aşağıdaki kod, süre sütunundaki zaman deltasını, zaman deltası sütunundaki toplam dakika sayısını temsil eden sayısal bir değere dönüştüren, dakika adı verilen yeni bir sütunun nasıl oluşturulacağını gösterir.

 #create new column that converts timedelta into total number of minutes
df[' minutes '] = df[' duration '] / pd. Timedelta (minutes= 1 )

#view updated DataFrame
print (df)

  promotion start end duration minutes
0 A 2021-10-04 13:29:00 2021-10-08 11:29:06 3 days 22:00:06 5640.100000  
1 B 2021-10-07 12:30:00 2021-10-15 10:30:07 7 days 22:00:07 11400.116667
2 C 2021-10-15 04:20:00 2021-10-29 05:50:15 14 days 01:30:15 20250.250000
3 D 2021-10-18 15:45:03 2021-10-22 15:40:03 3 days 23:55:00 5755.000000

Bu yeni sütunun veri türünü kontrol etmek için dtype’ı kullanabiliriz:

 #check datatype
df. minutes . dtype

dtype('float64')

Yeni sütun bir kayan noktadır.

Ek kaynaklar

Aşağıdaki eğitimlerde pandalarda diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

Pandalar’da sütunları DateTime’a dönüştürme
Pandalar’da DateTime’ı tarihe nasıl dönüştürebilirim?
Pandalar’da tarihten ay nasıl çıkarılır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir