Pandas: cara mengganti string kosong dengan nan


Anda dapat menggunakan sintaks berikut untuk mengganti string kosong dengan nilai NaN di panda:

 df = df. replace ( r'^\s*$' , np. nan , regex= True )

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Terkait: Cara mengganti nilai NaN dengan string di Pandas

Contoh: Ganti string kosong dengan NaN

Misalkan kita memiliki pandas DataFrame berikut yang berisi informasi tentang berbagai pemain bola basket:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', ' ', 'D', 'E', ' ', 'G', 'H'],
                   ' position ': [' ', 'G', 'G', 'F', 'F', ' ', 'C', 'C'],
                   ' points ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team position points rebounds
0 to 5 11
1 B G 7 8
2 G 7 10
3 D F 9 6
4 E F 12 6
5 9 5
6 G C 9 9
7 H C 4 12

Perhatikan bahwa ada beberapa string kosong di kolom tim dan posisi .

Kita dapat menggunakan sintaks berikut untuk mengganti string kosong ini dengan nilai NaN:

 import numpy as np

#replace empty values with NaN
df = df. replace ( r'^\s*$' , np. nan , regex= True )

#view updated DataFrame
df

team position points rebounds
0 A NaN 5 11
1 B G 7 8
2 NaN G 7 10
3 D F 9 6
4 E F 12 6
5 NaN NaN 9 5
6 G C 9 9
7 H C 4 127

Perhatikan bahwa setiap string kosong telah diganti dengan NaN.

Catatan : Anda dapat menemukan dokumentasi lengkap fungsi replace di pandas di sini .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:

Bagaimana cara memperhitungkan nilai yang hilang di panda
Cara menghitung nilai yang hilang di panda
Cara mengisi nilai NaN dengan mean di pandas

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *