Hoe panda's in intervallen van 5 minuten te groeperen


U kunt de volgende basissyntaxis gebruiken om rijen te groeperen in intervallen van 5 minuten in een Panda DataFrame:

 df. resample (' 5min '). sum ()

Deze specifieke formule gaat ervan uit dat de index van uw DataFrame datetime-waarden bevat en berekent de som van elke kolom in het DataFrame, gegroepeerd in intervallen van 5 minuten.

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Gerelateerd: Een inleiding tot resample() in panda’s

Voorbeeld: Panda’s groeperen in intervallen van 5 minuten

Laten we zeggen dat we het volgende panda’s DataFrame hebben dat de verkopen weergeeft die een bedrijf op verschillende datums en tijden heeft gerealiseerd:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' date ': pd.date_range (start=' 1/1/2020 ', freq=' min ', periods= 12 ),
                   ' sales ': [6, 8, 9, 11, 13, 8, 8, 15, 22, 9, 8, 4],
                   ' returns ': [0, 3, 2, 2, 1, 3, 2, 4, 1, 5, 3, 2]})

#set 'date' column as index
df = df. set_index (' date ')

#view DataFrame
print (df)

                     sales returns
date                               
2020-01-01 00:00:00 6 0
2020-01-01 00:01:00 8 3
2020-01-01 00:02:00 9 2
2020-01-01 00:03:00 11 2
2020-01-01 00:04:00 13 1
2020-01-01 00:05:00 8 3
2020-01-01 00:06:00 8 2
2020-01-01 00:07:00 15 4
2020-01-01 00:08:00 22 1
2020-01-01 00:09:00 9 5
2020-01-01 00:10:00 8 3
2020-01-01 00:11:00 4 2

Gerelateerd: Hoe u een datumbereik in Panda’s kunt maken

We kunnen de volgende syntaxis gebruiken om de som van de verkopen te berekenen, gegroepeerd in intervallen van 5 minuten:

 #calculate sum of sales and returns grouped by 5-minute intervals
df. resample (' 5min '). sum ()

                     sales returns
date		
2020-01-01 00:00:00 47 8
2020-01-01 00:05:00 62 15
2020-01-01 00:10:00 12 5

Zo interpreteert u het resultaat:

  • De totale omzet in minuten 0-4 was 47 en de totale opbrengsten waren 8 .
  • De totale omzet in minuten 5-9 bedroeg 62 en de totale opbrengsten waren 15 .
  • De totale omzet in minuten 10-14 was 1 2 en de totale opbrengsten waren 5 .

We kunnen een vergelijkbare syntaxis gebruiken om de maximale verkoopwaarden en retourwaarden te berekenen, gegroepeerd in intervallen van 5 minuten:

 #calculate max of sales and max of returns grouped by 5-minute intervals
df. resample (' 5min '). max ()

	             sales returns
date		
2020-01-01 00:00:00 13 3
2020-01-01 00:05:00 22 5
2020-01-01 00:10:00 8 3

We kunnen een vergelijkbare syntaxis gebruiken om elke waarde te berekenen die we willen groeperen in intervallen van 5 minuten.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in panda’s kunt uitvoeren:

Hoe je per dag onder panda’s kunt groeperen
Hoe te groeperen per week in panda’s
Hoe te groeperen op maand bij Pandas
Hoe te groeperen op kwartaal in Panda’s

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert