Deux termes que les étudiants confondent souvent en statistiques sont l’erreur type et la marge d’erreur . L’ erreur type mesure la précision d’une estimation d’une moyenne de population. Il est calculé comme suit : Erreur standard = s / √n où:...
Un diagramme de paires est une matrice de nuages de points qui vous permet de comprendre la relation par paire entre différentes variables d’un ensemble de données. Heureusement, il est facile de créer un tracé de paires dans R en utilisant...
La distribution binomiale décrit la probabilité d’obtenir k succès dans n expériences binomiales. Si une variable aléatoire X suit une distribution binomiale, alors la probabilité que X = k succès peut être trouvée par la formule suivante : P(X=k) = n C...
Une variable concomitante (parfois appelée « covariable ») est une variable qui n’est pas d’un intérêt primordial dans une étude, mais qui peut néanmoins avoir une certaine interaction avec la ou les variables d’intérêt étudiées. Ne pas tenir compte de ces...
La fréquence relative mesure la fréquence à laquelle une certaine valeur apparaît dans un ensemble de données par rapport au nombre total de valeurs dans un ensemble de données. Vous pouvez utiliser la fonction suivante en Python pour calculer les fréquences...
Un intervalle de confiance est une plage de valeurs susceptible de contenir un paramètre de population avec un certain niveau de confiance. Ce didacticiel explique comment tracer un intervalle de confiance pour un ensemble de données dans R. Exemple : tracer un...
Souvent, lorsque vous effectuez une régression linéaire simple, vous souhaiterez peut-être créer un nuage de points pour visualiser les différentes combinaisons de valeurs x et y ainsi que la droite de régression d’estimation. Heureusement, il existe deux manières simples de créer...
Un diagramme à tiges et à feuilles est un graphique qui affiche les données en divisant chaque valeur d’un ensemble de données en une tige et une feuille . Il s’agit d’un tracé unique car il nous aide à visualiser la...
Souvent, vous souhaiterez peut-être organiser les lignes d’un bloc de données dans R dans un ordre spécifique. Heureusement, cela est facile à faire en utilisant la fonction arrange() de la bibliothèque dplyr . Ce tutoriel explique plusieurs exemples d’utilisation pratique de...
Souvent, vous pourriez être intéressé à compter le nombre d’ observations par groupe dans R. Heureusement, cela est facile à faire en utilisant la fonction count() de la bibliothèque dplyr . Ce tutoriel explique plusieurs exemples d’utilisation pratique de cette fonction...