Le risque attribuable fait référence à la différence des taux d’incidence entre les personnes exposées à un facteur de risque et les personnes non exposées à ce facteur de risque. Par exemple, nous pourrions utiliser cette mesure pour comprendre la différence...
La régression linéaire est une méthode que nous pouvons utiliser pour quantifier la relation entre une ou plusieurs variables prédictives et une variable de réponse . Nous utilisons généralement la régression linéaire avec des variables quantitatives . Parfois appelées variables «...
Une variable factice est un type de variable que nous créons dans l’analyse de régression afin de pouvoir représenter une variable catégorielle comme une variable numérique qui prend l’une des deux valeurs suivantes : zéro ou un. Par exemple, supposons que nous...
Une variable factice est un type de variable que nous créons dans l’analyse de régression afin de pouvoir représenter une variable catégorielle comme une variable numérique qui prend l’une des deux valeurs suivantes : zéro ou un. Par exemple, supposons que nous...
La régression linéaire est une méthode que nous pouvons utiliser pour quantifier la relation entre une ou plusieurs variables prédictives et une variable de réponse . Nous utilisons généralement la régression linéaire avec des variables quantitatives . Parfois appelées variables «...
Deux termes parfois utilisés de manière interchangeable sont corrélation et association . Cependant, dans le domaine des statistiques, ces deux termes ont des significations légèrement différentes. En particulier, lorsque nous utilisons le mot corrélation , nous parlons généralement du coefficient de...
Nous pouvons utiliser la fonction DATEDIF() pour calculer la différence entre deux dates dans Excel. Cette fonction utilise la syntaxe suivante : =DATEDIF(Start_Date, End_Date, Métrique) où: Start_Date : la date de début End_Date : la date de fin Métrique : la métrique à calculer. Les options incluent :...
En statistique, on dit qu’une distribution de probabilité a une propriété sans mémoire si la probabilité qu’un événement futur se produise n’est pas affectée par l’occurrence d’événements passés. Il n’existe que deux distributions de probabilité possédant la propriété sans mémoire : La...
Nous pouvons utiliser la fonction pmax() pour trouver la valeur maximale sur plusieurs colonnes de R. Cette fonction utilise la syntaxe suivante : pmax(…, na.rm = FAUX) où: … : Une liste de vecteurs na.rm : un élément logique indiquant si les valeurs manquantes...
La fonction str_replace() du package stringr dans R peut être utilisée pour remplacer les modèles correspondants dans une chaîne. Cette fonction utilise la syntaxe suivante : str_replace(chaîne, motif, remplacement) où: chaîne : vecteur de caractères modèle : Modèle à rechercher remplacement : un vecteur de caractères...