So berechnen sie die spearman-rangkorrelation in python
In der Statistik bezeichnet Korrelation die Stärke und Richtung einer Beziehung zwischen zwei Variablen. Der Wert eines Korrelationskoeffizienten kann zwischen -1 und 1 liegen, mit folgenden Interpretationen:
- -1: eine perfekte negative Beziehung zwischen zwei Variablen
- 0: keine Beziehung zwischen zwei Variablen
- 1: eine perfekte positive Beziehung zwischen zwei Variablen
Eine besondere Art der Korrelation ist die Spearman-Rangkorrelation , mit der die Korrelation zwischen zwei Rangvariablen gemessen wird. (z. B. die Rangfolge der Mathematikprüfungsergebnisse eines Schülers im Verhältnis zur Rangfolge seiner naturwissenschaftlichen Prüfungsergebnisse in einer Klasse).
In diesem Tutorial wird erläutert, wie die Spearman-Rangkorrelation zwischen zwei Variablen in Python berechnet wird
Beispiel: Spearman-Rangkorrelation in Python
Angenommen, wir haben den folgenden Pandas-DataFrame, der die Ergebnisse der Mathematikprüfung und der naturwissenschaftlichen Prüfung von 10 Schülern in einer bestimmten Klasse enthält:
import pandas as pd #createDataFrame df = pd. DataFrame ({'student': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'], 'math': [70, 78, 90, 87, 84, 86, 91, 74, 83, 85], 'science': [90, 94, 79, 86, 84, 83, 88, 92, 76, 75]})
Um die Spearman-Rank-Korrelation zwischen Mathematik- und Naturwissenschaftsergebnissen zu berechnen, können wir die Funktion spearmanr() in scipy.stats verwenden:
from scipy. stats import spearmanr
#calculate Spearman Rank correlation and corresponding p-value
rho, p = spearmanr(df[' math '], df[' science '])
#print Spearman rank correlation and p-value
print (rho)
-0.41818181818181815
print (p)
0.22911284098281892
Aus dem Ergebnis können wir ersehen, dass die Spearman-Rangkorrelation -0,41818 beträgt und der entsprechende p-Wert 0,22911 beträgt.
Dies weist darauf hin, dass zwischen den Prüfungsergebnissen in Naturwissenschaften und Mathematik eine negative Korrelation besteht.
Da der p-Wert der Korrelation jedoch nicht kleiner als 0,05 ist, ist die Korrelation statistisch nicht signifikant.
Beachten Sie, dass wir auch die folgende Syntax verwenden könnten, um einfach den Korrelationskoeffizienten oder p-Wert zu extrahieren:
#extract Spearman Rank correlation coefficient
spearmanr(df[' math '], df[' science '])[0]
-0.41818181818181815
#extract p-value of Spearman Rank correlation coefficient
spearmanr(df[' math '], df[' science '])[1]
0.22911284098281892
Zusätzliche Ressourcen
So berechnen Sie die Spearman-Rangkorrelation in R
So berechnen Sie die Spearman-Rangkorrelation in Excel
So berechnen Sie die Spearman-Rangkorrelation in Stata