Pandy: jak znaleźć najstarszą datę w kolumnie
Aby znaleźć najstarszą datę w kolumnie ramki DataFrame pandy, możesz użyć następujących metod:
Metoda 1: Znajdź najstarszą datę w kolumnie
df[' date_column ']. min ()
Metoda 2: Znajdź w kolumnie wiersz z najstarszą datą
df. iloc [df[' date_column ']. argmin ()]
Poniższe przykłady pokazują, jak w praktyce używać tej składni z następującą ramką DataFrame pand:
import pandas as pd #createDataFrame df = pd. DataFrame ({' date ': pd.to_datetime (['2022-04-01', '2022-02-12', '2022-06-13', '2022-02-04', '2022-07-01', '2022-02-19', '2022-12-03', '2022-04-04']), ' sales ': [12, 15, 24, 24, 14, 19, 12, 38]}) #view DataFrame print (df) dirty date 0 2022-04-01 12 1 2022-02-12 15 2 2022-06-13 24 3 2022-02-04 24 4 2022-07-01 14 5 2022-02-19 19 6 2022-12-03 12 7 2022-04-04 38
Przykład 1: Znajdź najstarszą datę w kolumnie
Możemy użyć następującego kodu, aby znaleźć najstarszą datę w kolumnie daty ramki DataFrame:
#find earliest date in 'date' column df[' date ']. min () Timestamp('2022-02-04 00:00:00')
Z wyniku widzimy, że najstarsza data w kolumnie daty to 04.02.2022.
Uwaga : jeśli chcesz znaleźć najnowszą datę, po prostu zamień min() na max() w kodzie.
Przykład 2: Znajdź w kolumnie wiersz z najstarszą datą
Możemy użyć poniższego kodu, aby znaleźć wiersz z najstarszą datą w kolumnie daty DataFrame:
#find row with earliest date in 'date' column df. iloc [df[' date ']. argmin ()] date 2022-02-04 00:00:00 dirty 24 Name: 3, dtype: object
Dane wyjściowe wyświetlają cały wiersz zawierający najstarszą datę w kolumnie daty .
Na przykład w tym wierszu możemy zobaczyć następujące wartości:
- data : 02-04-2022
- brudny : 24
Jeśli chcesz znać tylko pozycję indeksu wiersza z najstarszą datą, możesz zastąpić .iloc przez .index w następujący sposób:
#find index position of row with earliest date in 'date' column df. index [df[' date ']. argmin ()] 3
To mówi nam, że wiersz z indeksem na pozycji 3 zawiera najstarszą datę w kolumnie daty .
Uwaga : jeśli chcesz znaleźć wiersz z najnowszą datą, po prostu zamień argmin() na argmax() w kodzie.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje na pandach:
Jak dodawać i odejmować dni od daty w Pandach
Jak wybrać wiersze między dwiema datami w Pandach
Jak utworzyć kolumnę daty z roku, miesiąca i dnia w Pandach