Vous pouvez utiliser le tri proc dans SAS pour supprimer rapidement les lignes en double d’un ensemble de données. Cette procédure utilise la syntaxe de base suivante : proc sort data=original_data out=no_dups_data nodupkey; by _all_; run; Notez que l’argument by spécifie les...
Un test U de Mann-Whitney (parfois appelé test de somme de rangs de Wilcoxon) est utilisé pour comparer les différences entre deux échantillons lorsque les distributions d’échantillons ne sont pas normalement distribuées et que les tailles d’échantillon sont petites (n <30)....
La distribution de Poisson et la distribution normale sont deux des distributions de probabilité les plus couramment utilisées en statistique. Ce didacticiel fournit une explication rapide de chaque distribution ainsi que deux différences clés entre les distributions. Un aperçu : la distribution...
En statistique, la normalisation quantile est une méthode qui rend deux distributions identiques en termes de propriétés statistiques. L’exemple suivant montre comment effectuer une normalisation quantile dans R. Exemple : normalisation quantile dans R Supposons que nous créions le bloc de données...
Vous pouvez utiliser la formule suivante pour calculer le rang centile des données groupées : Rang centile = L + (RN/100 – M) / F * C où: L : La limite inférieure de l’intervalle qui contient le rang centile R :...
Vous pouvez utiliser la formule suivante pour calculer le centile d’une distribution normale en fonction d’une moyenne et d’un écart type : Valeur centile = μ + zσ où: μ : Moyenne z : score z du tableau z qui correspond à la...
La fonction replace() dans R peut être utilisée pour remplacer des éléments spécifiques d’un vecteur par de nouvelles valeurs. Cette fonction utilise la syntaxe suivante : remplacer (x, liste, valeurs) où: x : Nom du vecteur list : Éléments à remplacer valeurs...
La régression linéaire simple est une technique que nous pouvons utiliser pour comprendre la relation entre une variable prédictive et une variable de réponse . Cette technique trouve une ligne qui « correspond » le mieux aux données et prend la...
Vous pouvez utiliser proc sgplot pour créer rapidement un nuage de points avec une ligne de régression dans SAS. Les exemples suivants montrent comment utiliser cette procédure dans la pratique. Exemple 1 : Créer un nuage de points de base avec une...
La régression linéaire multiple est une méthode que nous pouvons utiliser pour comprendre la relation entre deux ou plusieurs variables prédictives et une variable de réponse . Ce didacticiel explique comment effectuer une régression linéaire multiple dans SAS. Étape 1 : Créer...