Vous pouvez utiliser les méthodes suivantes pour obtenir la fréquence des valeurs dans une colonne d’un DataFrame pandas : Méthode 1 : obtenir le nombre de fréquences des valeurs sous forme de tableau df['my_column'].value_counts() Méthode 2 : obtenir le nombre de fréquences des valeurs...
Vous pouvez utiliser la syntaxe de base suivante pour compter les occurrences de valeurs True et False dans une colonne d’un DataFrame pandas : df['my_boolean_column'].value_counts() Cela comptera les occurrences des valeurs True et False. Si vous souhaitez uniquement compter une des valeurs...
Vous pouvez utiliser les méthodes suivantes pour sélectionner des colonnes dans un DataFrame pandas qui sont égales à un type de données spécifique : Méthode 1 : sélectionner des colonnes égales à un type de données spécifique #select all columns that have an int...
Vous pouvez utiliser la syntaxe de base suivante pour supprimer une ou plusieurs colonnes dans un DataFrame pandas si elles existent : df = df.drop(['column1', 'column2'], axis=1, errors='ignore') Remarque : Si vous n’utilisez pas l’argument error=’ignore’ , vous recevrez une erreur si vous...
Vous pouvez utiliser les méthodes suivantes pour calculer l’écart type par groupe chez les pandas : Méthode 1 : calculer l’écart type d’une colonne regroupée par une colonne df.groupby(['group_col'])['value_col'].std() Méthode 2 : calculer l’écart type de plusieurs colonnes regroupées par une seule colonne df.groupby(['group_col'])['value_col1',...
Vous pouvez utiliser la syntaxe de base suivante pour exécuter l’équivalent d’une instruction SQL « GROUP BY HAVING » dans les pandas : df.groupby('some_column').filter(lambda x: some condition) Les exemples suivants montrent comment utiliser cette syntaxe en pratique avec le DataFrame pandas suivant :...
Vous pouvez utiliser la syntaxe de base suivante pour créer une colonne booléenne basée sur une condition dans un DataFrame pandas : df['boolean_column'] = np.where(df['some_column'] > 15, True, False) Cette syntaxe particulière crée une nouvelle colonne booléenne avec deux valeurs possibles : Vrai...
Vous pouvez utiliser la syntaxe suivante pour soustraire un DataFrame pandas d’un autre : df1.subtract(df2) Si vous avez une colonne de caractères dans chaque DataFrame, vous devrez peut-être d’abord la déplacer vers la colonne d’index de chaque DataFrame : df1.set_index('char_column').subtract(df2.set_index('char_column')) Les exemples suivants...
Il existe deux façons d’ajouter une nouvelle colonne contenant des numéros de ligne dans un DataFrame pandas : Méthode 1 : utilisez assign() df = df.assign(row_number=range(len(df))) Méthode 2 : utilisez reset_index() df['row_number'] = df.reset_index().index Les deux méthodes produisent le même résultat. Les exemples suivants...
Vous pouvez utiliser la syntaxe suivante pour utiliser des caractères génériques dans une fonction FILTER dans Excel : =FILTER(A2:B12, ISNUMBER(SEARCH("some_string", A2:A12)), "None") Cette formule particulière filtrera les lignes de la plage A2:B12 où les cellules de la plage A2:A12 contiennent « some_string...