Cara mengelompokkan panda dalam interval 5 menit


Anda dapat menggunakan sintaks dasar berikut untuk mengelompokkan baris ke dalam interval 5 menit di pandas DataFrame:

 df. resample (' 5min '). sum ()

Rumus khusus ini mengasumsikan bahwa indeks DataFrame Anda berisi nilai tanggal dan waktu dan menghitung jumlah setiap kolom di DataFrame, yang dikelompokkan ke dalam interval 5 menit.

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Terkait:Pengantar resample() di pandas

Contoh: Cara mengelompokkan panda dalam interval 5 menit

Katakanlah kita memiliki panda DataFrame berikut yang menunjukkan penjualan yang dilakukan oleh suatu perusahaan pada tanggal dan waktu berbeda:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' date ': pd.date_range (start=' 1/1/2020 ', freq=' min ', periods= 12 ),
                   ' sales ': [6, 8, 9, 11, 13, 8, 8, 15, 22, 9, 8, 4],
                   ' returns ': [0, 3, 2, 2, 1, 3, 2, 4, 1, 5, 3, 2]})

#set 'date' column as index
df = df. set_index (' date ')

#view DataFrame
print (df)

                     sales returns
date                               
2020-01-01 00:00:00 6 0
2020-01-01 00:01:00 8 3
2020-01-01 00:02:00 9 2
2020-01-01 00:03:00 11 2
2020-01-01 00:04:00 13 1
2020-01-01 00:05:00 8 3
2020-01-01 00:06:00 8 2
2020-01-01 00:07:00 15 4
2020-01-01 00:08:00 22 1
2020-01-01 00:09:00 9 5
2020-01-01 00:10:00 8 3
2020-01-01 00:11:00 4 2

Terkait: Cara Membuat Rentang Tanggal di Pandas

Kita dapat menggunakan sintaks berikut untuk menghitung jumlah penjualan yang dikelompokkan berdasarkan interval 5 menit:

 #calculate sum of sales and returns grouped by 5-minute intervals
df. resample (' 5min '). sum ()

                     sales returns
date		
2020-01-01 00:00:00 47 8
2020-01-01 00:05:00 62 15
2020-01-01 00:10:00 12 5

Berikut cara menafsirkan hasilnya:

  • Total penjualan pada menit 0-4 adalah 47 dan total pengembalian adalah 8 .
  • Total penjualan pada menit 5-9 adalah 62 dan total pengembalian adalah 15 .
  • Total penjualan pada menit 10-14 adalah 1 2 dan total pengembalian adalah 5 .

Kita dapat menggunakan sintaks serupa untuk menghitung nilai penjualan maksimum dan nilai pengembalian, yang dikelompokkan dalam interval 5 menit:

 #calculate max of sales and max of returns grouped by 5-minute intervals
df. resample (' 5min '). max ()

	             sales returns
date		
2020-01-01 00:00:00 13 3
2020-01-01 00:05:00 22 5
2020-01-01 00:10:00 8 3

Kita dapat menggunakan sintaks serupa untuk menghitung nilai apa pun yang ingin kita kelompokkan ke dalam interval 5 menit.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di panda:

Cara mengelompokkan panda berdasarkan hari
Cara mengelompokkan panda berdasarkan minggu
Cara mengelompokkan berdasarkan bulan di Pandas
Cara mengelompokkan berdasarkan kuartal di Pandas

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *