Pandas : Comment remplacer les chaînes vides par NaN



Vous pouvez utiliser la syntaxe suivante pour remplacer les chaînes vides par des valeurs NaN dans les pandas :

df = df.replace(r'^\s*$', np.nan, regex=True)

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Connexe : Comment remplacer les valeurs NaN par une chaîne dans Pandas

Exemple : Remplacer les chaînes vides par NaN

Supposons que nous ayons le DataFrame pandas suivant qui contient des informations sur divers joueurs de basket-ball :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'B', ' ', 'D', 'E', ' ', 'G', 'H'],
                   'position': [' ', 'G', 'G', 'F', 'F', ' ', 'C', 'C'],
                   'points': [5, 7, 7, 9, 12, 9, 9, 4],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team	position points	rebounds
0	A		 5	11
1	B	G	 7	8
2		G	 7	10
3	D	F	 9	6
4	E	F	 12	6
5			 9	5
6	G	C	 9	9
7	H	C	 4	12

Notez qu’il y a plusieurs chaînes vides dans les colonnes équipe et position .

Nous pouvons utiliser la syntaxe suivante pour remplacer ces chaînes vides par des valeurs NaN :

import numpy as np

#replace empty values with NaN
df = df.replace(r'^\s*$', np.nan, regex=True)

#view updated DataFrame
df

	team	position points	rebounds
0	A	NaN	 5	11
1	B	G	 7	8
2	NaN	G	 7	10
3	D	F	 9	6
4	E	F	 12	6
5	NaN	NaN	 9	5
6	G	C	 9	9
7	H	C	 4	127

Notez que chacune des chaînes vides a été remplacée par NaN.

Remarque : Vous pouvez trouver la documentation complète de la fonction de remplacement dans pandas ici .

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans les pandas :

Comment imputer les valeurs manquantes chez les pandas
Comment compter les valeurs manquantes chez les pandas
Comment remplir les valeurs NaN avec la moyenne chez les pandas

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *