Jak wyodrębnić miesiąc z daty w pandach (z przykładami)
Aby wyodrębnić miesiąc z daty w pandach, możesz użyć następującej podstawowej składni:
df[' month '] = pd. DatetimeIndex (df[' date_column ']). month
Poniższy przykład pokazuje, jak w praktyce wykorzystać tę funkcję.
Przykład: wyodrębnij miesiąc z daty w Pandach
Załóżmy, że mamy następującą ramkę DataFrame pand:
import pandas as pd #createDataFrame df = pd. DataFrame ({' sales_date ': ['2020-01-18', '2020-02-20', '2020-03-21'], ' total_sales ': [675, 500, 575]}) #view DataFrame print (df) sales_date total_sales 0 2020-01-18 675 1 2020-02-20 500 2 2020-03-21 575
Możemy użyć następującej składni, aby utworzyć nową kolumnę zawierającą miesiąc kolumny „data_sprzedaży”:
#extract month as new column
df[' month '] = pd. DatetimeIndex (df[' sales_date ']). month
#view updated DataFrame
print (df)
sales_date total_sales month
0 2020-01-18 675 1
1 2020-02-20 500 2
2 2020-03-21 575 3
Możemy również użyć następującej składni, aby utworzyć nową kolumnę zawierającą rok kolumny „data_sprzedaży”:
#extract year as new column
df[' year '] = pd. DatetimeIndex (df[' sales_date ']). year
#view updated DataFrame
print (df)
sales_date total_sales month year
0 2020-01-18 675 1 2020
1 2020-02-20 500 2 2020
2 2020-03-21 575 3 2020
Należy pamiętać, że jeśli w DataFrame znajdują się wartości NaN, funkcja ta automatycznie wygeneruje wartości NaN dla odpowiednich wartości w nowych kolumnach miesiąca i roku.
Powiązane: Jak sortować ramkę danych Pandy według daty
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje na pandach:
Pandy: jak liczyć wystąpienia określonej wartości w kolumnie
Pandy: pobierz indeks wierszy, których kolumna odpowiada wartości
Pandy: Jak policzyć brakujące wartości w DataFrame