Pandy: jak znaleźć najstarszą datę w kolumnie


Aby znaleźć najstarszą datę w kolumnie ramki DataFrame pandy, możesz użyć następujących metod:

Metoda 1: Znajdź najstarszą datę w kolumnie

 df[' date_column ']. min ()

Metoda 2: Znajdź w kolumnie wiersz z najstarszą datą

 df. iloc [df[' date_column ']. argmin ()]

Poniższe przykłady pokazują, jak w praktyce używać tej składni z następującą ramką DataFrame pand:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' date ': pd.to_datetime (['2022-04-01', '2022-02-12',
                                           '2022-06-13', '2022-02-04',
                                           '2022-07-01', '2022-02-19',
                                           '2022-12-03', '2022-04-04']),
                   ' sales ': [12, 15, 24, 24, 14, 19, 12, 38]})

#view DataFrame
print (df)

        dirty date
0 2022-04-01 12
1 2022-02-12 15
2 2022-06-13 24
3 2022-02-04 24
4 2022-07-01 14
5 2022-02-19 19
6 2022-12-03 12
7 2022-04-04 38

Przykład 1: Znajdź najstarszą datę w kolumnie

Możemy użyć następującego kodu, aby znaleźć najstarszą datę w kolumnie daty ramki DataFrame:

 #find earliest date in 'date' column
df[' date ']. min ()

Timestamp('2022-02-04 00:00:00')

Z wyniku widzimy, że najstarsza data w kolumnie daty to 04.02.2022.

Uwaga : jeśli chcesz znaleźć najnowszą datę, po prostu zamień min() na max() w kodzie.

Przykład 2: Znajdź w kolumnie wiersz z najstarszą datą

Możemy użyć poniższego kodu, aby znaleźć wiersz z najstarszą datą w kolumnie daty DataFrame:

 #find row with earliest date in 'date' column
df. iloc [df[' date ']. argmin ()]

date 2022-02-04 00:00:00
dirty 24
Name: 3, dtype: object

Dane wyjściowe wyświetlają cały wiersz zawierający najstarszą datę w kolumnie daty .

Na przykład w tym wierszu możemy zobaczyć następujące wartości:

  • data : 02-04-2022
  • brudny : 24

Jeśli chcesz znać tylko pozycję indeksu wiersza z najstarszą datą, możesz zastąpić .iloc przez .index w następujący sposób:

 #find index position of row with earliest date in 'date' column
df. index [df[' date ']. argmin ()]

3

To mówi nam, że wiersz z indeksem na pozycji 3 zawiera najstarszą datę w kolumnie daty .

Uwaga : jeśli chcesz znaleźć wiersz z najnowszą datą, po prostu zamień argmin() na argmax() w kodzie.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje na pandach:

Jak dodawać i odejmować dni od daty w Pandach
Jak wybrać wiersze między dwiema datami w Pandach
Jak utworzyć kolumnę daty z roku, miesiąca i dnia w Pandach

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *