Jak wyodrębnić miesiąc z daty w pandach (z przykładami)


Aby wyodrębnić miesiąc z daty w pandach, możesz użyć następującej podstawowej składni:

 df[' month '] = pd. DatetimeIndex (df[' date_column ']). month

Poniższy przykład pokazuje, jak w praktyce wykorzystać tę funkcję.

Przykład: wyodrębnij miesiąc z daty w Pandach

Załóżmy, że mamy następującą ramkę DataFrame pand:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' sales_date ': ['2020-01-18', '2020-02-20', '2020-03-21'],
                   ' total_sales ': [675, 500, 575]})

#view DataFrame
print (df)

   sales_date total_sales
0 2020-01-18 675
1 2020-02-20 500
2 2020-03-21 575

Możemy użyć następującej składni, aby utworzyć nową kolumnę zawierającą miesiąc kolumny „data_sprzedaży”:

 #extract month as new column
df[' month '] = pd. DatetimeIndex (df[' sales_date ']). month

#view updated DataFrame
print (df)

	sales_date total_sales month
0 2020-01-18 675 1
1 2020-02-20 500 2
2 2020-03-21 575 3

Możemy również użyć następującej składni, aby utworzyć nową kolumnę zawierającą rok kolumny „data_sprzedaży”:

 #extract year as new column
df[' year '] = pd. DatetimeIndex (df[' sales_date ']). year

#view updated DataFrame
print (df)

        sales_date total_sales month year
0 2020-01-18 675 1 2020
1 2020-02-20 500 2 2020
2 2020-03-21 575 3 2020

Należy pamiętać, że jeśli w DataFrame znajdują się wartości NaN, funkcja ta automatycznie wygeneruje wartości NaN dla odpowiednich wartości w nowych kolumnach miesiąca i roku.

Powiązane: Jak sortować ramkę danych Pandy według daty

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje na pandach:

Pandy: jak liczyć wystąpienia określonej wartości w kolumnie
Pandy: pobierz indeks wierszy, których kolumna odpowiada wartości
Pandy: Jak policzyć brakujące wartości w DataFrame

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *