Korrelationen in stata: pearson, spearman und kendall


In der Statistik bezeichnet Korrelation die Stärke und Richtung einer Beziehung zwischen zwei Variablen. Der Wert eines Korrelationskoeffizienten kann zwischen -1 und 1 liegen, wobei -1 eine perfekte negative Beziehung angibt, 0 keine Beziehung angibt und 1 eine perfekte positive Beziehung angibt.

Es gibt drei gängige Methoden zur Messung der Korrelation:

Pearson-Korrelation: Wird zur Messung der Korrelation zwischen zwei kontinuierlichen Variablen verwendet. (z. B. Größe und Gewicht)

Spearman-Korrelation: Wird verwendet, um die Korrelation zwischen zwei klassifizierten Variablen zu messen. (z. B. Rangfolge der Mathematikprüfungsergebnisse eines Schülers im Vergleich zur Rangfolge seiner naturwissenschaftlichen Prüfungsergebnisse in einer Klasse)

Kendall-Korrelation: Wird verwendet, wenn Sie die Spearman-Korrelation verwenden möchten, die Stichprobengröße jedoch klein ist und es viele verwandte Rankings gibt.

In diesem Tutorial wird erklärt, wie Sie die drei Arten von Korrelationen in Stata finden.

Daten werden geladen

Für jedes der folgenden Beispiele verwenden wir einen Datensatz namens auto . Sie können diesen Datensatz laden, indem Sie Folgendes in das Befehlsfeld eingeben:

Verwenden Sie https://www.stata-press.com/data/r13/auto

Wir können uns einen schnellen Überblick über den Datensatz verschaffen, indem wir Folgendes in das Befehlsfeld eingeben:

zusammenfassen

Fassen Sie einen Beispielbefehl in Stata zusammen

Wir können sehen, dass der Datensatz insgesamt 12 Variablen enthält.

So finden Sie die Pearson-Korrelation in Stata

Mit dem Befehl pwcorr können wir den Pearson-Korrelationskoeffizienten zwischen den Gewichts- und Längenvariablen ermitteln:

pwcorr Gewichtslänge

Pearson-Korrelation in Stata

Der Pearson-Korrelationskoeffizient zwischen diesen beiden Variablen beträgt 0,9460 . Um festzustellen, ob dieser Korrelationskoeffizient signifikant ist, können wir den Wert von p mithilfe des Befehls sig ermitteln:

pwcorr Gewichtslänge, sig

Bedeutung der Pearson-Korrelation in Stata

Der p-Wert beträgt 0,000 . Da dieser Wert unter 0,05 liegt, ist die Korrelation zwischen diesen beiden Variablen statistisch signifikant.

Um den Pearson-Korrelationskoeffizienten für mehrere Variablen zu ermitteln, geben Sie einfach eine Liste von Variablen nach dem Befehl pwcorr ein:

pwcorr Gewichtslängenverschiebung, sig

Pearson-Korrelation für mehrere Variablen in Stata

So interpretieren Sie das Ergebnis:

  • Pearson-Korrelation zwischen Gewicht und Länge = 0,9460 | p-Wert = 0,000
  • Pearson-Korrelation zwischen Gewicht und Verschiebung = 0,8949 | p-Wert = 0,000
  • Pearson-Korrelation zwischen Verschiebung und Länge = 0,8351 | p-Wert = 0,000

So finden Sie Spearmans Korrelation in Stata

Mit dem Spearman- Befehl können wir den Spearman-Korrelationskoeffizienten zwischen den Variablen Trunk und Rep78 ermitteln:

Lanzenstamm rep78

Spearman-Korrelation in Stata

So interpretieren Sie das Ergebnis:

  • Anzahl der Beobachtungen: Dies ist die Anzahl der paarweisen Beobachtungen, die zur Berechnung des Spearman-Korrelationskoeffizienten verwendet werden. Da einige Werte für die Variable rep78 fehlten, verwendete Stata nur 69 Beobachtungen pro Paar (statt der vollen 74).
  • Spearman’s Rho: Dies ist der Spearman-Korrelationskoeffizient. In diesem Fall beträgt er -0,2235, was darauf hinweist, dass zwischen den beiden Variablen eine negative Korrelation besteht. Während das eine zunimmt, nimmt das andere tendenziell ab.
  • Wahrscheinlich > |t| : Dies ist der p-Wert, der dem Hypothesentest zugeordnet ist. In diesem Fall beträgt der p-Wert 0,0649, was darauf hinweist, dass bei α = 0,05 keine statistisch signifikante Korrelation zwischen den beiden Variablen besteht.

Wir können den Spearman-Korrelationskoeffizienten für mehrere Variablen ermitteln, indem wir einfach nach dem Spearman- Befehl weitere Variablen eingeben. Mit dem Befehl stats(rho p) können wir den Korrelationskoeffizienten und den entsprechenden p-Wert für jede paarweise Korrelation ermitteln:

Spearman Trunk Rep78 Gear_Ratio, Statistiken (Rho P)

Spearman-Korrelation für mehrere Variablen in Stata

So interpretieren Sie das Ergebnis:

  • Spearman-Korrelation zwischen Rumpf und rep78 = -0,2235 | p-Wert = 0,0649
  • Spearman-Korrelation zwischen Rumpf und Getriebeverhältnis = -0,5187 | p-Wert = 0,0000
  • Spearman-Korrelation zwischen gear_ratio und rep78 = 0,4275 | p-Wert = 0,0002

So finden Sie die Kendall-Korrelation in Stata

Mit dem Befehl ktau können wir den Kendall-Korrelationskoeffizienten zwischen den Stamm- und rep78 -Variablen ermitteln:

ktau Stamm rep78

Kendalls Korrelation in Stata

So interpretieren Sie das Ergebnis:

  • Anzahl der Beobachtungen: Dies ist die Anzahl der paarweisen Beobachtungen, die zur Berechnung des Kendall-Korrelationskoeffizienten verwendet werden. Da einige Werte für die Variable rep78 fehlten, verwendete Stata nur 69 Beobachtungen pro Paar (statt der vollen 74).
  • Kendalls Tau-b: Dies ist der Kendall-Korrelationskoeffizient zwischen den beiden Variablen. Im Allgemeinen verwenden wir diesen Wert anstelle von Tau-a, da Tau-b bei Unentschieden Anpassungen vornimmt. In diesem Fall ist tau-b = -0,1752, was auf eine negative Korrelation zwischen den beiden Variablen hinweist.
  • Wahrscheinlich > |z| : Dies ist der p-Wert, der dem Hypothesentest zugeordnet ist. In diesem Fall beträgt der p-Wert 0,0662, was darauf hinweist, dass bei α = 0,05 keine statistisch signifikante Korrelation zwischen den beiden Variablen besteht.

Wir können den Kendall-Korrelationskoeffizienten für mehrere Variablen ermitteln, indem wir einfach nach dem Befehl ktau weitere Variablen eingeben. Mit dem Befehl stats(taub p) können wir den Korrelationskoeffizienten und den entsprechenden p-Wert für jede paarweise Korrelation ermitteln:

Ktau Trunk Rep78 Gear_Ratio, Statistiken (Taub P)

Kendalls Tau für mehrere Variablen in Stata

  • Kendall-Korrelation zwischen Stamm und rep78 = -0,1752 | p-Wert = 0,0662
  • Kendalls Korrelation zwischen Rumpf und Getriebeverhältnis = -0,3753 | p-Wert = 0,0000
  • Kendall-Korrelation zwischen gear_ratio und rep78 = 0,3206 | p-Wert = 0,0006

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert