Le test exact de Fisher est utilisé pour déterminer s’il existe ou non une association significative entre deux variables catégorielles. Il est généralement utilisé comme alternative au test d’indépendance du chi carré lorsqu’un ou plusieurs comptes de cellules dans un tableau...
Vous pouvez utiliser la syntaxe de base suivante pour modifier les intervalles des axes sur un tracé en base R : #create plot with no axis intervals plot(x, y, xaxt='n', yaxt='n') #specifty x-axis interval axis(side=1, at=c(1, 5, 10, 15)) #specify y-axis interval...
Vous pouvez utiliser l’argument theme() dans ggplot2 pour modifier les zones de marge d’un tracé : ggplot(df, aes(x=x)) + geom_histogram() + theme(plot.margin=unit(c(5,1,1,1), 'cm')) Gardez à l’esprit que l’ordre des marges du tracé est le suivant : unité(c(haut, droite, bas, gauche), unités) Les exemples...
Vous pouvez utiliser les fonctions suivantes du package lubridate dans R pour trouver rapidement le jour de la semaine : Méthode 1 : Rechercher le jour numérique de la semaine (en supposant que la semaine commence le dimanche) wday(df$date_column) Méthode 2 : Rechercher le...
De nombreux tests statistiques supposent que les ensembles de données sont normalement distribués. Il existe quatre manières courantes de vérifier cette hypothèse dans R : 1. (Méthode visuelle) Créez un histogramme. Si l’histogramme est à peu près en forme de « cloche...
Le V de Cramer est une mesure de la force de l’association entre deux variables nominales . Il va de 0 à 1 où : 0 indique aucune association entre les deux variables. 1 indique une association parfaite entre les deux...
L’ erreur type d’une pente de régression est un moyen de mesurer « l’incertitude » dans l’estimation d’une pente de régression. Il est calculé comme suit : où: n : taille totale de l’échantillon y i : valeur réelle de la variable de...
Les modèles de régression sont utilisés pour quantifier la relation entre une ou plusieurs variables prédictives et une variable de réponse . Chaque fois que nous ajustons un modèle de régression, nous voulons comprendre dans quelle mesure le modèle est capable...
Il existe deux scénarios courants dans lesquels il est judicieux d’utiliser une échelle logarithmique lors de la création de graphiques : Scénario 1 : quelques valeurs sont nettement supérieures à toutes les autres valeurs. En utilisant une échelle logarithmique, il est plus facile de...
Un graphique semi-logarithmique est un type de graphique qui utilise une échelle linéaire sur l’axe des x et une échelle logarithmique sur l’axe des y. Nous utilisons souvent ce type de graphique lorsque les valeurs de la variable y ont une...