Vous pouvez utiliser les méthodes suivantes pour créer une matrice NumPy avec des nombres aléatoires : Méthode 1 : créer une matrice NumPy d’entiers aléatoires np.random.randint(low, high, (rows, columns)) Méthode 2 : créer une matrice NumPy de flotteurs aléatoires np.random.rand(rows, columns) Les exemples...
Vous pouvez utiliser les fonctions np.mean() ou np.average() pour calculer la valeur moyenne d’un tableau en Python. Voici la subtile différence entre les deux fonctions : np.mean calcule toujours la moyenne arithmétique. np.average a un paramètre de pondération facultatif qui peut...
Vous pouvez utiliser la syntaxe de base suivante pour ajouter plusieurs DataFrames pandas à la fois : import pandas as pd #append multiple DataFrames df_big = pd.concat([df1,df2, df3], ignore_index=True) Cette syntaxe particulière ajoutera df1 , df2 et df3 dans un seul DataFrame...
Vous pouvez utiliser la syntaxe suivante pour remplacer les valeurs NaN dans une colonne d’un DataFrame pandas par la valeur de mode de la colonne : df['col1'] = df['col1'].fillna(df['col1'].mode()[0]) L’exemple suivant montre comment utiliser cette syntaxe dans la pratique. Exemple : remplacer les valeurs...
Vous pouvez utiliser la syntaxe suivante pour remplacer les valeurs NaN dans une colonne d’un DataFrame pandas par les valeurs d’une autre colonne : df['col1'] = df['col1'].fillna(df['col2']) Cette syntaxe particulière remplacera toutes les valeurs NaN dans col1 par les valeurs correspondantes dans...
Vous pouvez utiliser la syntaxe suivante pour compter le nombre de combinaisons uniques sur deux colonnes dans un DataFrame pandas : df[['col1', 'col2']].value_counts().reset_index(name='count') L’exemple suivant montre comment utiliser cette syntaxe dans la pratique. Exemple : compter les combinaisons uniques de deux colonnes dans...
En statistiques, un test d’hypothèse est utilisé pour tester une hypothèse sur un paramètre de population . Il existe de nombreux types de tests d’hypothèse que vous pouvez effectuer en fonction du type de données avec lesquelles vous travaillez et de...
De nombreux tests statistiques supposent que les valeurs d’un ensemble de données sont normalement distribuées . L’un des moyens les plus simples de tester cette hypothèse consiste à effectuer un test de Jarque-Bera , qui est un test d’ajustement qui détermine...
Un tableau croisé est un tableau qui résume la relation entre deux variables catégorielles. L’exemple étape par étape suivant montre comment créer un tableau croisé dans Google Sheets. Étape 1 : Saisissez les données Tout d’abord, entrons l’ensemble de données suivant dans Google...
La moyenne représente la valeur moyenne dans un ensemble de données. Cela nous donne une bonne idée de l’endroit où se trouve le centre d’un ensemble de données. L’ écart type représente la répartition des valeurs dans un ensemble de données....