Personnaliser les préférences

Nous utilisons des cookies pour vous aider à naviguer efficacement et à exécuter certaines fonctions. Vous trouverez ci-dessous des informations détaillées sur tous les cookies sous chaque catégorie de consentement.

Les cookies classés comme « Nécessaires » sont stockés sur votre navigateur car ils sont essentiels pour activer les fonctionnalités de base du site.... 

Toujours actif

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

Aucun cookie à afficher.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

Aucun cookie à afficher.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

Aucun cookie à afficher.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

Aucun cookie à afficher.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

Aucun cookie à afficher.

Comment vérifier si une colonne existe dans Pandas (avec exemples)



Vous pouvez utiliser les méthodes suivantes pour vérifier si une colonne existe dans un DataFrame pandas :

Méthode 1 : vérifier si une colonne existe

'column1' in df.columns

Cela renverra True si « colonne1 » existe dans le DataFrame, sinon il renverra False .

Méthode 2 : vérifier s’il existe plusieurs colonnes

{'column1', 'column2'}.issubset(df.columns)

Cela renverra True si « colonne1 » et « colonne2 » existent dans le DataFrame, sinon il renverra False .

Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le DataFrame pandas suivant :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   'points': [18, 22, 19, 14, 14, 11, 20, 28],
                   'assists': [5, 7, 7, 9, 12, 9, 9, 4],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print(df)

  team  points  assists  rebounds
0    A      18        5        11
1    B      22        7         8
2    C      19        7        10
3    D      14        9         6
4    E      14       12         6
5    F      11        9         5
6    G      20        9         9
7    H      28        4        12

Exemple 1 : vérifier s’il existe une colonne

Nous pouvons utiliser le code suivant pour voir si la colonne ‘team’ existe dans le DataFrame :

#check if 'team' column exists in DataFrame
'team' in df.columns

True

La colonne « équipe » existe dans le DataFrame, donc pandas renvoie une valeur True .

Nous pouvons également utiliser une instruction if pour effectuer une opération si la colonne « équipe » existe :

#if 'team' exists, create new column called 'team_name'
if 'team' in df.columns:
    df['team_name'] = df['team']
    
#view updated DataFrame
print(df)

  team  points  assists  rebounds team_name
0    A      18        5        11         A
1    B      22        7         8         B
2    C      19        7        10         C
3    D      14        9         6         D
4    E      14       12         6         E
5    F      11        9         5         F
6    G      20        9         9         G
7    H      28        4        12         H

Exemple 2 : vérifier s’il existe plusieurs colonnes

Nous pouvons utiliser le code suivant pour voir si les colonnes ‘team’ et ‘player’ existent dans le DataFrame :

#check if 'team' and 'player' columns both exist in DataFrame
{'team', 'player'}.issubset(df.columns)

False

La colonne ‘team’ existe dans le DataFrame mais pas ‘player’, donc pandas renvoie une valeur False .

Nous pourrions également utiliser le code suivant pour voir si les « points » et les « assistances » existent dans le DataFrame :

#check if 'points' and 'assists' columns both exist in DataFrame
{'points', 'assists'}.issubset(df.columns)

True

Les deux colonnes existent, donc pandas renvoie une valeur True .

Nous pouvons ensuite utiliser une instruction if pour effectuer une opération si les « points » et les « assistances » existent :

#if both exist, create new column called 'total' that finds sum of points and assists
if {'points', 'assists'}.issubset(df.columns):
    df['total'] = df['points'] + df['assists']
    
#view updated DataFrame
print(df)

     team   points assists rebounds  total
0	A	18	 5	 11	23
1	B	22	 7	  8	29
2	C	19	 7	 10	26
3	D	14	 9	  6	23
4	E	14	12	  6	26
5	F	11	 9	  5	20
6	G	20	 9	  9	29
7	H	28	 4	 12	32

Étant donné que les « points » et les « passes décisives » existent tous deux dans le DataFrame, les pandas ont créé une nouvelle colonne appelée « total » qui montre la somme des colonnes « points » et « passes décisives ».

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans les pandas :

Comment conserver certaines colonnes dans Pandas
Comment sélectionner des colonnes par index dans Pandas
Comment déplacer une colonne dans Pandas

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *