So normalisieren sie daten in sas


Eine Reihe von Datenwerten zu „normalisieren“ bedeutet, die Werte so zu skalieren, dass der Mittelwert aller Werte 0 und die Standardabweichung 1 beträgt.

In diesem Tutorial wird erläutert, wie Sie Daten in SAS normalisieren.

Beispiel: So normalisieren Sie Daten in SAS

Angenommen, wir haben den folgenden Datensatz:

Führen Sie die folgenden Schritte aus, um diesen Satz von Datenwerten in SAS zu normalisieren.

Schritt 1: Erstellen Sie den Datensatz

Lassen Sie uns zunächst den folgenden Code verwenden, um den Datensatz in SAS zu erstellen:

 /*create dataset*/
data original_data;
    input values;
    datalines ;
12
14
15
15
16
17
18
20
24
25
26
29
32
34
37
;
run ;

/*view mean and standard deviation of dataset*/
proc means data =original_data Mean StdDev ndec= 3 ; 
   var values;
run ; 

Aus dem Ergebnis können wir ersehen, dass der Mittelwert des Datensatzes 22,267 und die Standardabweichung 7,968 beträgt.

Schritt 2: Normalisieren Sie den Datensatz

Als nächstes verwenden wir proc stdize , um den Datensatz zu normalisieren:

 /*normalize the dataset*/
proc stdize data =original_data out =normalized_data;
   var values;
run ;

/*print normalized dataset*/
proc print data =normalized_data;
 
/*view mean and standard deviation of normalized dataset*/
proc means data =normalized_data Mean StdDev ndec= 2 ; 
   var values;
run ; 

Aus dem Ergebnis können wir ersehen, dass der Mittelwert des normalisierten Datensatzes 0 und die Standardabweichung 1 beträgt.

Schritt 3: Interpretieren Sie die normalisierten Daten

SAS verwendete die folgende Formel zur Normalisierung der Datenwerte:

Normalisierter Wert = (x – x ) / s

Gold:

  • x = Datenwert
  • x = Mittelwert des Datensatzes
  • s = Standardabweichung des Datensatzes

Jeder normalisierte Wert gibt uns die Anzahl der Standardabweichungen zwischen dem ursprünglichen Datenwert und dem Mittelwert an.

Betrachten Sie beispielsweise den Datenpunkt „12“ in unserem Originaldatensatz. Der ursprüngliche Stichprobenmittelwert betrug 22,267 und die ursprüngliche Stichprobenstandardabweichung betrug 7,968.

Der normalisierte Wert für „12“ betrug -1,288 und wurde wie folgt berechnet:

Normalisierter Wert = (x – x ) / s = (12 – 22,267) / 7,968 = -1,288

Dies sagt uns, dass der Wert „12“ 1,288 Standardabweichungen niedriger ist als der Mittelwert des Originaldatensatzes.

Jeder der normalisierten Werte im Datensatz kann uns helfen zu verstehen, wie nahe oder weit ein bestimmter Datenwert vom Mittelwert entfernt ist.

Ein kleiner normalisierter Wert zeigt an, dass ein Wert nahe am Mittelwert liegt, während ein großer normalisierter Wert angibt, dass ein Wert weit vom Mittelwert entfernt ist.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in SAS ausführen:

So verwenden Sie die Verfahrenszusammenfassung in SAS
So berechnen Sie die Korrelation in SAS
So erstellen Sie Häufigkeitstabellen in SAS

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert