So berechnen sie die mahalanobis-distanz in spss


Der Mahalanobis-Abstand ist der Abstand zwischen zwei Punkten in einem multivariaten Raum. Es wird häufig verwendet, um Ausreißer in statistischen Analysen mit mehreren Variablen zu erkennen.

In diesem Tutorial wird erläutert, wie Sie die Mahalanobis-Distanz in SPSS berechnen.

Beispiel: Mahalanobis-Distanz in SPSS

Angenommen, wir verfügen über den folgenden Datensatz, der die Prüfungsergebnisse von 20 Studenten zusammen mit der Anzahl der Lernstunden, der Anzahl der von ihnen abgelegten Übungsprüfungen und ihrer aktuellen Note im Kurs anzeigt:

Mit den folgenden Schritten können wir die Mahalanobis-Distanz für jede Beobachtung im Datensatz berechnen, um festzustellen, ob es multivariate Ausreißer gibt.

Schritt 1: Wählen Sie die Option „Lineare Regression“.

Klicken Sie auf die Registerkarte „Analysieren“ , dann auf „Regression“ und dann auf „Linear“ :

Schritt 2: Wählen Sie die Option Mahalanobis.

Ziehen Sie den Wert der Antwortvariablen in das Feld mit der Bezeichnung „Abhängig“. Ziehen Sie die anderen drei Prädiktorvariablen in das Feld mit der Bezeichnung „Independent(s)“. Klicken Sie dann auf die Schaltfläche Speichern . Stellen Sie im neuen Fenster sicher, dass das Kontrollkästchen neben Mahalanobis aktiviert ist. Klicken Sie dann auf Weiter . Klicken Sie dann auf OK .

Mahalanobis-Distanz in SPSS

Sobald Sie auf „OK“ klicken, wird die Mahalanobis-Distanz für jede Beobachtung im Datensatz in einer neuen Spalte mit dem Titel MAH_1 angezeigt:

Wir können sehen, dass einige Entfernungen viel größer sind als andere. Um festzustellen, ob eine der Abstände statistisch signifikant ist, müssen wir ihre p-Werte berechnen.

Schritt 3: Berechnen Sie die p-Werte jeder Mahalanobis-Distanz.

Klicken Sie auf die Registerkarte „Transformation“ und dann auf „Variable berechnen“ .

Wählen Sie im Feld „Zielvariable“ einen neuen Namen für die Variable, die Sie erstellen. Wir denken „p-Wert“. Geben Sie im Feld „Numerischer Ausdruck“ Folgendes ein:

1 – CDF.CHISQ(MAH_1, 3)

Klicken Sie dann auf OK .

Dadurch entsteht ein p-Wert, der dem Chi-Quadrat-Wert mit 3 Freiheitsgraden entspricht. Wir verwenden drei Freiheitsgrade, da unser Regressionsmodell drei Prädiktorvariablen enthält.

Schritt 4: Interpretieren Sie die p-Werte.

Sobald Sie auf „OK“ klicken, wird der p-Wert für jede Mahalanobis-Distanz in einer neuen Spalte angezeigt:

P-Werte für die Mahalanobis-Distanz in SPSS

Standardmäßig zeigt SPSS nur p-Werte mit zwei Dezimalstellen an. Sie können die Anzahl der Dezimalstellen erhöhen, indem Sie unten in SPSS auf Variablen anzeigen klicken und die Zahl in der Spalte „Dezimalstellen “ erhöhen:

Sobald Sie zur Datenansicht zurückkehren, wird jeder p-Wert mit fünf Dezimalstellen angezeigt. Jeder p-Wert unter 0,001 gilt als Ausreißer.

Wir können sehen, dass die erste Beobachtung der einzige Ausreißer im Datensatz ist, da sie einen p-Wert von weniger als 0,001 hat:

Wie man mit Ausreißern umgeht

Wenn in Ihren Daten ein Ausreißer vorhanden ist, haben Sie mehrere Möglichkeiten:

1. Stellen Sie sicher, dass der Ausreißer nicht auf einen Dateneingabefehler zurückzuführen ist.

Manchmal gibt eine Person beim Speichern der Daten einfach den falschen Datenwert ein. Wenn ein Ausreißer vorhanden ist, überprüfen Sie zunächst, ob der Datenwert korrekt eingegeben wurde und kein Fehler vorliegt.

2. Entfernen Sie den Ausreißer.

Wenn der Wert wirklich ein Ausreißer ist, können Sie ihn entfernen, wenn er erhebliche Auswirkungen auf Ihre Gesamtanalyse hat. Erwähnen Sie in Ihrem Abschlussbericht oder Ihrer Analyse unbedingt, dass Sie einen Ausreißer entfernt haben.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert