Vous pouvez utiliser la syntaxe de base suivante pour ajouter une légende à un tracé dans pandas : plt.legend(['A', 'B', 'C', 'D'], loc='center left', title='Legend Title') L’exemple suivant montre comment utiliser cette syntaxe dans la pratique. Exemple : créer et personnaliser une légende...
Vous pouvez utiliser la fonction pandas read_html() pour lire des tableaux HTML dans un pandas DataFrame. Cette fonction utilise la syntaxe de base suivante : df = pd.read_html('https://en.wikipedia.org/wiki/National_Basketball_Association') L’exemple suivant montre comment utiliser cette fonction pour lire un tableau des noms d’équipes...
Le test exact de Fisher est utilisé pour déterminer s’il existe ou non une association significative entre deux variables catégorielles. Il est généralement utilisé comme alternative au test d’indépendance du chi carré lorsqu’un ou plusieurs comptes de cellules dans un tableau...
Le test de Kolmogorov-Smirnov est utilisé pour déterminer si un échantillon est normalement distribué ou non. Ce test est largement utilisé car de nombreux tests et procédures statistiques supposent que les données sont normalement distribuées. L’exemple étape par étape suivant montre...
Les boxplots sont utiles pour visualiser rapidement le résumé en cinq chiffres d’un ensemble de données, qui comprend : La valeur minimale Le premier quartile La médiane Le troisième quartile La valeur maximale L’exemple suivant montre comment créer des boxplots groupés dans...
Vous pouvez utiliser le résumé de procédure dans SAS pour calculer rapidement les statistiques descriptives suivantes pour une ou plusieurs variables d’un ensemble de données : N : Le nombre total d’observations MIN : La valeur minimale MAX : La valeur maximale...
Vous pouvez utiliser proc freq dans SAS pour créer rapidement des tableaux de fréquence pour une ou plusieurs variables d’un ensemble de données. Les exemples suivants montrent comment utiliser cette procédure avec l’ensemble de données intégré SAS appelé BirthWgt , qui...
Une façon de quantifier la relation entre deux variables consiste à utiliser le coefficient de corrélation de Pearson , qui mesure l’association linéaire entre deux variables . Il prend toujours une valeur comprise entre -1 et 1 où : -1 indique...
Un test d’ajustement du chi carré est utilisé pour déterminer si une variable catégorielle suit ou non une distribution hypothétique. L’exemple suivant explique comment effectuer un test d’adéquation du chi carré dans SAS. Exemple : test d’adéquation du chi carré dans SAS...
Un test d’indépendance du chi carré est utilisé pour déterminer s’il existe ou non une association significative entre deux variables catégorielles . L’exemple suivant montre comment effectuer un test d’indépendance du chi carré dans SAS. Exemple : test d’indépendance du chi carré...