Une transformation box-cox est une méthode couramment utilisée pour transformer un ensemble de données non normalement distribué en un ensemble plusnormalement distribué . L’idée de base derrière cette méthode est de trouver une valeur pour λ telle que les données transformées...
Le test de White est utilisé pour déterminer si l’hétéroscédasticité est présente dans un modèle de régression. L’hétéroscédasticité fait référence à la dispersion inégale des résidus à différents niveaux d’une variable de réponse dans un modèle de régression, ce qui viole...
La distance de Cook est utilisée pour identifier les observations influentes dans un modèle de régression. La formule de la distance de Cook est la suivante : ré je = (r je 2 / p*MSE) * (h ii / (1-h ii )...
De nombreux tests statistiques supposent que les valeurs d’une variable particulière sont normalement distribuées . Cependant, les valeurs ne sont souvent pas distribuées normalement. Une façon de résoudre ce problème consiste à transformer la variable en prenant le journal de chaque...
Dans l’analyse de régression, la multicolinéarité se produit lorsque deux ou plusieurs variables prédictives sont fortement corrélées les unes aux autres, de sorte qu’elles ne fournissent pas d’informations uniques ou indépendantes dans le modèle de régression. Si le degré de corrélation...
Vous pouvez utiliser l’instruction PROC IMPORT pour importer rapidement des données d’un fichier texte dans SAS. Cette procédure utilise la syntaxe de base suivante : /*import data from text file called data.txt*/ proc import out=my_data datafile="/home/u13181/data.txt" dbms=dlm replace; getnames=YES; run; Voici ce...
Vous pouvez utiliser l’instruction PROC EXPORT pour exporter rapidement des données de SAS vers un fichier texte. Cette procédure utilise la syntaxe de base suivante : /*export data to file called my_data.txt*/ proc export data=my_data outfile="/home/u13181/my_data.txt" dbms=tab replace; run; Voici ce que...
Vous pouvez utiliser l’instruction PROC IMPORT avec l’option RANGE pour importer une plage spécifique de cellules d’un fichier Excel dans SAS. Pour ce faire, vous pouvez utiliser la syntaxe de base suivante : /*import data from Excel file called basketball_data.xlsx*/ proc import...
Un test F est utilisé pour tester si deux variances de population sont égales. Les hypothèses nulles et alternatives du test sont les suivantes : H 0 : σ 1 2 = σ 2 2 (les variances de population sont égales) H...
Une matrice de corrélation est un tableau carré qui montre les coefficients de corrélation entre les variables d’un ensemble de données. Il offre un moyen rapide de comprendre la force des relations linéaires qui existent entre les variables d’un ensemble de...