Un coefficient de corrélation de Pearson , souvent noté r , mesure l’association linéaire entre deux variables. Il prend toujours une valeur comprise entre -1 et 1 où : -1 indique une corrélation linéaire parfaitement négative entre deux variables 0 indique...
La corrélation de rang de Spearman est utilisée pour mesurer la corrélation entre deux variables classées. (par exemple, le rang de la note à l’examen de mathématiques d’un élève par rapport au rang de sa note à l’examen de sciences dans...
Une ANOVA bidirectionnelle est utilisée pour déterminer s’il existe ou non une différence statistiquement significative entre les moyennes de trois groupes indépendants ou plus qui ont été répartis sur deux variables. Lorsque nous rapportons les résultats d’une ANOVA bidirectionnelle, nous utilisons...
Il existe deux façons de calculer la moyenne géométrique en Python : Méthode 1 : calculer la moyenne géométrique à l’aide de SciPy from scipy.stats import gmean #calculate geometric mean gmean([value1, value2, value3, ...]) Méthode 2 : calculer la moyenne géométrique à l’aide de...
Vous pouvez utiliser la syntaxe suivante pour ajouter une légende à un nuage de points dans Matplotlib : import matplotlib.pyplot as plt from matplotlib.colors import ListedColormap #define values, classes, and colors to map values = [0, 0, 1, 2, 2, 2] classes...
Le moyen le plus simple de créer un tracé de densité dans Matplotlib est d’utiliser la fonction kdeplot() de la bibliothèque de visualisation seaborn : import seaborn as sns #define data data = [value1, value2, value3, ...] #create density plot of data...
Vous pouvez utiliser la syntaxe suivante pour masquer les axes dans les tracés Matplotlib : import matplotlib.pyplot as plt #get current axes ax = plt.gca() #hide x-axis ax.get_xaxis().set_visible(False) #hide y-axis ax.get_yaxis().set_visible(False) Les exemples suivants montrent comment utiliser cette syntaxe dans la pratique....
Vous pouvez utiliser la syntaxe suivante pour définir une colonne dans un DataFrame pandas comme index : #set one column as index df.set_index('col1') #set multiple columns as multi index df.set_index(['col1', 'col2']) Les exemples suivants montrent comment utiliser cette syntaxe en pratique avec...
Vous pouvez utiliser la syntaxe suivante pour créer des boxplots à partir d’un DataFrame pandas : #create boxplot of one column df.boxplot(column=['col1']) #create boxplot of multiple columns df.boxplot(column=['col1', 'col2']) #create boxplot grouped by one column df.boxplot(column=['col1'], by='col2') Les exemples suivants montrent comment...
La bibliothèque de visualisation de données Python Seaborn n’a pas de fonction par défaut pour créer des diagrammes circulaires, mais vous pouvez utiliser la syntaxe suivante dans Matplotlib pour créer un diagramme circulaire et ajouter une palette de couleurs Seaborn : import...