Konfidenzintervall für einen korrelationskoeffizienten
Ein Konfidenzintervall für einen Korrelationskoeffizienten ist ein Wertebereich, der wahrscheinlich einen Populationskorrelationskoeffizienten mit einem bestimmten Konfidenzniveau enthält.
In diesem Tutorial wird Folgendes erklärt:
- Die Motivation für die Erstellung dieses Konfidenzintervalltyps.
- Die Formel zum Erstellen dieses Konfidenzintervalltyps.
- Ein Beispiel für die Erstellung dieses Konfidenzintervalltyps.
- Wie ist diese Art von Konfidenzintervall zu interpretieren?
Konfidenzintervall für einen Korrelationskoeffizienten: Motivation
Der Grund für die Erstellung eines Konfidenzintervalls für einen Korrelationskoeffizienten besteht darin, unsere Unsicherheit bei der Schätzung eines Populationskorrelationskoeffizienten zu erfassen.
Angenommen, wir möchten den Korrelationskoeffizienten zwischen der Größe und dem Gewicht der Einwohner eines bestimmten Landkreises schätzen. Da es im Landkreis Tausende von Einwohnern gibt, wäre es zu teuer und zeitaufwändig, herumzulaufen und Informationen über die Größe und das Gewicht jedes einzelnen Einwohners zu sammeln.
Stattdessen könnten wir eine einfache Zufallsstichprobe von Bewohnern auswählen und einfach Informationen über sie sammeln.
Da wir eine Zufallsstichprobe von Bewohnern auswählen, gibt es keine Garantie dafür, dass der Korrelationskoeffizient zwischen der Größe und dem Gewicht dieser in die Stichprobe einbezogenen Bewohner genau mit dem Korrelationskoeffizienten der größeren Bevölkerung übereinstimmt.
Um diese Unsicherheit zu erfassen, können wir ein Konfidenzintervall erstellen, das einen Wertebereich enthält, der wahrscheinlich den wahren Korrelationskoeffizienten zwischen der Größe und dem Gewicht der Einwohner in diesem Landkreis enthält.
Konfidenzintervall für einen Korrelationskoeffizienten: Formel
Wir verwenden die folgenden Schritte, um ein Konfidenzintervall für einen Populationskorrelationskoeffizienten basierend auf der Stichprobengröße n und dem Stichprobenkorrelationskoeffizienten r zu berechnen.
Schritt 1: Führen Sie die Fisher-Transformation durch.
Sei z r = ln((1+r) / (1-r)) / 2
Schritt 2: Ermitteln Sie die Ober- und Untergrenze des Protokolls.
Sei L = z r – (z 1-α/2 /√ n-3 )
Sei U = z r + (z 1-α/2 /√ n-3 )
Schritt 3: Finden Sie das Konfidenzintervall.
Das endgültige Konfidenzintervall kann mit der folgenden Formel ermittelt werden:
Konfidenzintervall = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]
Konfidenzintervall für einen Korrelationskoeffizienten: Beispiel
Angenommen, wir möchten den Korrelationskoeffizienten zwischen der Größe und dem Gewicht der Einwohner eines bestimmten Landkreises schätzen. Wir wählen eine Zufallsstichprobe von 30 Bewohnern aus und finden folgende Informationen:
- Stichprobengröße n = 30
- Korrelationskoeffizient zwischen Größe und Gewicht r = 0,56
So ermitteln Sie ein 95 %-Konfidenzintervall für den Bevölkerungskorrelationskoeffizienten:
Schritt 1: Führen Sie die Fisher-Transformation durch.
Sei z r = ln((1+r) / (1-r)) / 2 = ln((1+.56) / (1-.56)) / 2 = 0,6328
Schritt 2: Ermitteln Sie die Ober- und Untergrenze des Protokolls.
Sei L = z r – (z 1-α/2 /√ n-3 ) = 0,6328 – (1,96 /√ 30-3 ) = 0,2556
Sei U = z r + (z 1-α/2 /√ n-3 ) = 0,6328 + (1,96 /√ 30-3 ) = 1,01
Schritt 3: Finden Sie das Konfidenzintervall.
Konfidenzintervall = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]
Konfidenzintervall = [(e 2(.2556) -1)/(e 2(.2556) +1), (e 2(1.01) -1)/(e 2(1.01) +1)] = [. 2502, .7658]
Hinweis: Sie können dieses Konfidenzintervall auch mithilfe des Konfidenzintervalls für einen Korrelationskoeffizientenrechner ermitteln.
Konfidenzintervall für einen Korrelationskoeffizienten: Interpretation
Die Art und Weise, wie wir ein Konfidenzintervall interpretieren würden, ist:
Es besteht eine Wahrscheinlichkeit von 95 %, dass das Konfidenzintervall von [.2502, .7658] den tatsächlichen Bevölkerungskorrelationskoeffizienten zwischen der Größe und dem Gewicht der Einwohner dieses Landkreises enthält.
Anders ausgedrückt: Die Wahrscheinlichkeit, dass der tatsächliche Bevölkerungskorrelationskoeffizient außerhalb des 95-%-Konfidenzintervalls liegt, beträgt nur 5 %.
Das heißt, es besteht nur eine 5-prozentige Wahrscheinlichkeit, dass der tatsächliche Bevölkerungskorrelationskoeffizient zwischen der Größe und dem Gewicht der Einwohner dieses Landkreises weniger als 0,2502 oder mehr als 0,7658 beträgt.