So führen sie eine protokolltransformation in sas durch

Viele statistische Tests gehen davon aus, dass die Werte einer bestimmten Variablen normalverteilt sind.

Allerdings sind die Werte häufig nicht normalverteilt. Eine Möglichkeit, dieses Problem zu lösen, besteht darin, die Variable zu transformieren, indem der Logarithmus jedes Werts erstellt wird.

Durch die Durchführung dieser Transformation nähert sich eine Variable im Allgemeinen der Normalverteilung an.

Das folgende Beispiel zeigt, wie eine Protokolltransformation für eine Variable in SAS durchgeführt wird.

Beispiel: Protokolltransformation in SAS

Nehmen wir an, wir haben den folgenden Datensatz in SAS:

 /*create dataset*/
data my_data;
    input x;
    datalines ;
1
1
1
2
2
2
2
2
2
3
3
3
6
7
8
;
run ;

/*view dataset*/
proc print data =my_data;

Wir können PROC UNIVARIATE verwenden, um Normalitätstests für die Variable x durchzuführen, um zu bestimmen, ob sie normalverteilt ist, und außerdem ein Histogramm zu erstellen, um die Verteilung der Werte zu visualisieren:

 /*create histogram and perform normality tests*/
proc univariate data =my_data normal ; 
histogram x;
run ; 

In der letzten Tabelle mit dem Titel „Normalitätstests“ können wir sehen, dass der p-Wert des Shapiro-Wilk-Tests kleiner als 0,05 ist, was einen starken Beweis dafür liefert, dass die Variable x nicht normalverteilt ist.

Das Histogramm zeigt auch, dass die Verteilung der Werte nicht normalverteilt zu sein scheint:

Wir können eine Protokolltransformation des ursprünglichen Datensatzes versuchen, um zu sehen, ob wir einen normalverteilten Datensatz erstellen können.

Wir können den folgenden Code verwenden, um einen neuen Datensatz in SAS zu erstellen, in dem wir das Protokoll jedes der ursprünglichen x-Werte erstellen:

 /*use log transformation to create new dataset*/
data log_data;
    set my_data;
    x = log (x);
run ;

/*view log transformed data*/
proc print data =log_data; 

Anschließend können wir PROC UNIVARIATE erneut verwenden, um Normalitätstests für die transformierte Variable durchzuführen und außerdem ein Histogramm zu erstellen:

 /*create histogram and perform normality tests*/
proc univariate data =log_data normal ; 
histogram x;
run ; 

In der letzten Tabelle mit dem Titel „Normalitätstests“ können wir sehen, dass der p-Wert für den Shapiro-Wilk-Test jetzt größer als 0,05 ist.

Das Histogramm zeigt auch, dass die Werteverteilung etwas normaler ist als vor der Transformation:

Basierend auf den Ergebnissen des Shapiro-Wilk-Tests und dem oben dargestellten Histogramm würden wir schlussfolgern, dass die logarithmische Transformation eine viel normaler verteilte Variable als die ursprüngliche Variable erzeugt hat.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in SAS ausführen:

So identifizieren Sie Ausreißer in SAS
So berechnen Sie die Kochdistanz in SAS
So erstellen Sie Histogramme in SAS

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert