Cdf oder pdf: was ist der unterschied?
Dieses Tutorial bietet eine einfache Erklärung des Unterschieds zwischen einer PDF (Wahrscheinlichkeitsdichtefunktion) und einer CDF (kumulative Verteilungsfunktion) in der Statistik.
Zufällige Variablen
Bevor wir ein PDF oder CDF definieren können, müssen wir zunächst Zufallsvariablen verstehen.
Eine Zufallsvariable , üblicherweise mit X bezeichnet, ist eine Variable, deren Werte die numerischen Ergebnisse eines Zufallsprozesses sind. Es gibt zwei Arten von Zufallsvariablen: diskrete und kontinuierliche.
Diskrete Zufallsvariablen
Eine diskrete Zufallsvariable ist eine Variable, die nur eine abzählbare Anzahl unterschiedlicher Werte annehmen kann, wie 0, 1, 2, 3, 4, 5 … 100, 1 Million usw. Hier sind einige Beispiele für diskrete Zufallsvariablen:
- Die Häufigkeit, mit der eine Münze „Zahl“ erhält, nachdem sie 20 Mal geworfen wurde.
- Die Häufigkeit, mit der ein Würfel auf der Zahl 4 landet, nachdem er 100 Mal gewürfelt wurde.
Kontinuierliche Zufallsvariablen
Eine kontinuierliche Zufallsvariable ist eine Variable, die unendlich viele mögliche Werte annehmen kann. Hier sind einige Beispiele für kontinuierliche Zufallsvariablen:
- Größe einer Person
- Gewicht eines Tieres
- Die Zeit, die man braucht, um eine Meile zu laufen
Die Körpergröße einer Person könnte beispielsweise 60,2 Zoll, 65,2344 Zoll, 70,431222 Zoll usw. betragen. Es gibt unendlich viele mögliche Werte für die Größe.
Allgemeine Faustregel: Wenn Sie die Anzahl der Ergebnisse zählen können, dann arbeiten Sie mit einer diskreten Zufallsvariablen (z. B. zählen Sie, wie oft eine Münze „Kopf“ zeigt). Wenn Sie das Ergebnis jedoch messen können, arbeiten Sie mit einer kontinuierlichen Zufallsvariablen (z. B. Größe, Größe, Gewicht, Zeit usw.).
Wahrscheinlichkeitsdichtefunktionen
Eine Wahrscheinlichkeitsdichtefunktion (PDF) gibt uns die Wahrscheinlichkeit an, mit der eine Zufallsvariable einen bestimmten Wert annimmt.
Angenommen, wir würfeln einmal. Wenn wir x die Zahl bezeichnen, auf der die Würfel landen, dann kann die Wahrscheinlichkeitsdichtefunktion für das Ergebnis wie folgt beschrieben werden:
P(x < 1) : 0
P(x = 1) : 1/6
P(x = 2) : 1/6
P(x = 3) : 1/6
P(x = 4) : 1/6
P(x = 5) : 1/6
P(x = 6) : 1/6
P(x > 6) : 0
Beachten Sie, dass dies ein Beispiel für eine diskrete Zufallsvariable ist, da x nur ganzzahlige Werte annehmen kann.
Für eine kontinuierliche Zufallsvariable können wir kein PDF direkt verwenden, da die Wahrscheinlichkeit, dass x einen exakten Wert annimmt, Null ist.
Angenommen, wir möchten die Wahrscheinlichkeit wissen, dass ein Hamburger aus einem bestimmten Restaurant ein Viertel Pfund (0,25 Pfund) wiegt. Da das Gewicht eine kontinuierliche Variable ist, kann es unendlich viele Werte annehmen.
Beispielsweise könnte ein bestimmter Hamburger tatsächlich 0,250001 Pfund, 0,24 Pfund oder 0,2488 Pfund wiegen. Die Wahrscheinlichkeit, dass ein bestimmter Hamburger genau 0,25 Pfund wiegt, ist praktisch Null.
Kumulative Verteilungsfunktionen
Eine kumulative Verteilungsfunktion (cdf) gibt uns die Wahrscheinlichkeit an, dass eine Zufallsvariable einen Wert kleiner oder gleich x annimmt.
Angenommen, wir würfeln einmal. Wenn wir x die Zahl bezeichnen, auf der die Würfel landen, dann kann die kumulative Verteilungsfunktion des Ergebnisses wie folgt beschrieben werden:
P(x ≤ 0) : 0
P(x ≤ 1) : 1/6
P(x ≤ 2) : 2/6
P(x ≤ 3) : 3/6
P(x ≤ 4) : 4/6
P(x ≤ 5) : 5/6
P(x ≤ 6) : 6/6
P(x > 6) : 0
Beachten Sie, dass die Wahrscheinlichkeit, dass x kleiner oder gleich 6 ist, 6/6 beträgt, was gleich 1 ist. Dies liegt daran, dass die Würfel mit einer Wahrscheinlichkeit von 100 % auf 1, 2, 3, 4, 5 oder 6 landen.
In diesem Beispiel wird eine diskrete Zufallsvariable verwendet, aber eine kontinuierliche Dichtefunktion kann auch für eine kontinuierliche Zufallsvariable verwendet werden.
Kumulative Verteilungsfunktionen haben die folgenden Eigenschaften:
- Die Wahrscheinlichkeit, dass eine Zufallsvariable einen Wert annimmt, der kleiner als der kleinstmögliche Wert ist, ist Null. Beispielsweise ist die Wahrscheinlichkeit, dass ein Würfel auf einem Wert kleiner als 1 landet, Null.
- Die Wahrscheinlichkeit, dass eine Zufallsvariable einen Wert annimmt, der kleiner oder gleich dem größtmöglichen Wert ist, beträgt eins. Beispielsweise ist die Wahrscheinlichkeit, dass ein Würfel auf einem Wert von 1, 2, 3, 4, 5 oder 6 landet, eins. Es muss auf einer dieser Nummern landen.
- Der CDF nimmt immer nicht ab. Das heißt, die Wahrscheinlichkeit, dass ein Würfel auf eine Zahl kleiner oder gleich 1 fällt, beträgt 1/6, die Wahrscheinlichkeit, dass er auf eine Zahl kleiner oder gleich 2 fällt, beträgt 2/6, die Wahrscheinlichkeit, auf a zu fallen Zahl kleiner oder gleich 3 ist 3/6 usw. Die kumulativen Wahrscheinlichkeiten nehmen immer nicht ab.
Verwandt: Sie können ein Ogivendiagramm verwenden, um eine kumulative Verteilungsfunktion zu visualisieren.
Die Beziehung zwischen einem CDF und einem PDF
Technisch gesehen ist eine Wahrscheinlichkeitsdichtefunktion (pdf) die Ableitung einer kumulativen Verteilungsfunktion (cdf).
Darüber hinaus ist die Fläche unter der Kurve einer PDF zwischen negativer Unendlichkeit und x gleich dem Wert von x auf der CDF.
Eine ausführliche Erklärung der Beziehung zwischen einem PDF und einem CDF sowie den Beweis, warum das PDF die Ableitung des CDF ist, finden Sie in einem Statistiklehrbuch.