Jak przekonwertować kolumny pandas dataframe na ciągi
Często możesz chcieć przekonwertować jedną lub więcej kolumn ramki DataFrame pand na ciągi znaków. Na szczęście można to łatwo zrobić, korzystając z wbudowanej w pandę funkcji astype(str) .
W tym samouczku przedstawiono kilka przykładów użycia tej funkcji.
Przykład 1: Konwertuj pojedynczą kolumnę DataFrame na ciąg znaków
Załóżmy, że mamy następującą ramkę danych pandy:
import pandas as pd #createDataFrame df = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E'], 'points': [25, 20, 14, 16, 27], 'assists': [5, 7, 7, 8, 11]}) #view DataFrame df player points assists 0 to 25 5 1 B 20 7 2 C 14 7 3 D 16 8 4 E 27 11
Możemy zidentyfikować typ danych każdej kolumny za pomocą dtypes:
df. dtypes
player object
int64 dots
assists int64
dtype:object
Widzimy, że kolumna „gracz” jest ciągiem znaków, podczas gdy pozostałe dwie kolumny „punkty” i „podania” są liczbami całkowitymi.
Możemy przekonwertować kolumnę „punkty” na ciąg znaków, po prostu używając funkcji astype(str) w następujący sposób:
df['points'] = df['points'].astype( str )
Możemy ponownie sprawdzić, czy ta kolumna jest teraz ciągiem znaków, używając dtypes:
df. dtypes
player object
points object
assists int64
dtype:object
Przykład 2: Konwertuj wiele kolumn DataFrame na ciągi
Obie kolumny „punkty” i „pomocy” możemy przekonwertować na ciągi znaków, stosując następującą składnię:
df[['points', 'assists']] = df[['points', 'assists']].astype( str )
I znowu możemy sprawdzić, czy są to ciągi znaków, używając dtypes:
df. dtypes
player object
points object
assists object
dtype:object
Przykład 3: Konwertuj całą ramkę danych na ciągi znaków
Na koniec możemy przekonwertować każdą kolumnę ramki DataFrame na ciągi znaków, używając następującej składni:
#convert every column to strings df = df.astype(str) #check data type of each column df. dtypes player object points object assists object dtype:object
Pełną dokumentację funkcji astype() można znaleźć tutaj .