Covariance.p vs. covariance.s in excel: was ist der unterschied?
In der Statistik ist Kovarianz eine Methode zur Messung, wie Änderungen einer Variablen mit Änderungen einer anderen Variablen verbunden sind.
Ein positiver Kovarianzwert gibt an, dass ein Anstieg einer Variablen mit einem Anstieg einer anderen Variablen verbunden ist.
Ein negativer Wert zeigt an, dass ein Anstieg einer Variablen mit einem Rückgang einer anderen Variablen verbunden ist.
Es gibt zwei verschiedene Funktionen, mit denen Sie die Kovarianz in Excel berechnen können:
1. COVARIANCE.P: Diese Funktion berechnet die Populationskovarianz. Verwenden Sie diese Funktion, wenn der Wertebereich die gesamte Grundgesamtheit darstellt.
Diese Funktion verwendet die folgende Formel:
Populationskovarianz = Σ(x i – x )(y i – y ) / n
Gold:
- Σ: Ein griechisches Symbol mit der Bedeutung „Summe“
- x i : Der i- te Wert der Variablen x
- x : Der Durchschnittswert der Variablen x
- y i : der i-te Wert der Variablen y
- y : Der Durchschnittswert der Variablen y
- n: Die Gesamtzahl der Beobachtungen
2. COVARIANCE.S: Diese Funktion berechnet die Stichprobenkovarianz. Verwenden Sie diese Funktion, wenn der Wertebereich eine Stichprobe von Werten und nicht eine gesamte Grundgesamtheit darstellt.
Diese Funktion verwendet die folgende Formel:
Stichprobenkovarianz = Σ(x i – x )(y i – y ) / (n-1)
Gold:
- Σ: Ein griechisches Symbol mit der Bedeutung „Summe“
- x i : Der i- te Wert der Variablen x
- x : Der Durchschnittswert der Variablen x
- y i : der i-te Wert der Variablen y
- y : Der Durchschnittswert der Variablen y
- n: Die Gesamtzahl der Beobachtungen
Beachten Sie den subtilen Unterschied zwischen den beiden Formeln: COVARIANCE.P dividiert durch n , während COVARIANCE.S durch n-1 dividiert.
Aus diesem Grund ergibt die Formel COVARIANCE.S immer einen größeren Wert, da sie durch einen kleineren Wert dividiert.
Das folgende Beispiel zeigt, wie die einzelnen Formeln in der Praxis verwendet werden.
Beispiel: COVARIANCE.P vs. COVARIANCE.S in Excel
Nehmen wir an, wir haben den folgenden Datensatz in Excel, der die Punkte und Assists von 15 verschiedenen Basketballspielern zeigt:
Der folgende Screenshot zeigt, wie die Kovarianz zwischen Punkten und Assists mithilfe der beiden verschiedenen Kovarianzformeln berechnet wird:
Die Stichprobenkovarianz beträgt 15,69 und die Populationskovarianz 14,64 .
Wie bereits erwähnt, ist die Stichprobenkovarianz immer größer als die Populationskovarianz.
Wann ist COVARIANCE.P oder COVARIANCE.S zu verwenden?
In den meisten Fällen ist es uns nicht möglich, Daten für eine gesamte Bevölkerung zu sammeln. Wir erheben daher Daten nur für eine Stichprobe der Bevölkerung.
Daher verwenden wir fast immer COVARIANCE.S, um die Kovarianz eines Datensatzes zu berechnen, da unser Datensatz im Allgemeinen eine Stichprobe darstellt.
In seltenen Fällen, in denen Ihre Daten eine gesamte Population darstellen, können Sie stattdessen die Funktion COVARIANCE.P verwenden.
Zusätzliche Ressourcen
Die folgenden Tutorials erklären den Unterschied zwischen anderen häufig verwendeten Excel-Funktionen:
STDEV.P vs. STDEV.S in Excel: Was ist der Unterschied?
PERCENTILE.EXC vs. PERCENTILE.INC in Excel: Was ist der Unterschied?
QUARTILE.EXC vs. QUARTILE.INC in Excel: Was ist der Unterschied?