Cdf of pdf: wat is het verschil?
Deze tutorial biedt een eenvoudige uitleg van het verschil tussen een PDF (kansdichtheidsfunctie) en een CDF (cumulatieve verdelingsfunctie) in statistieken.
Willekeurige variabelen
Voordat we een PDF of CDF kunnen definiëren, moeten we eerst willekeurige variabelen begrijpen.
Eenwillekeurige variabele , meestal aangeduid met X, is een variabele waarvan de waarden de numerieke resultaten zijn van een willekeurig proces. Er zijn twee soorten willekeurige variabelen: discreet en continu.
Discrete willekeurige variabelen
Een discrete willekeurige variabele is een variabele die slechts een telbaar aantal verschillende waarden kan aannemen, zoals 0, 1, 2, 3, 4, 5… 100, 1 miljoen, enz. Hier zijn enkele voorbeelden van discrete willekeurige variabelen:
- Het aantal keren dat een munt munt krijgt nadat hij twintig keer is gegooid.
- Het aantal keren dat een dobbelsteen op nummer 4 belandt nadat hij 100 keer is gegooid.
Continue willekeurige variabelen
Een continue willekeurige variabele is een variabele die een oneindig aantal mogelijke waarden kan aannemen. Hier zijn enkele voorbeelden van continue willekeurige variabelen:
- Hoogte van een persoon
- Gewicht van een dier
- De tijd die nodig is om een mijl te lopen
De lengte van een persoon kan bijvoorbeeld 60,2 inch, 65,2344 inch, 70,431222 inch, enz. Zijn. Er zijn oneindig veel mogelijke waarden voor grootte.
Algemene vuistregel: Als je het aantal uitkomsten kunt tellen , dan werk je met een discrete willekeurige variabele (bijvoorbeeld het tellen van het aantal keren dat een munt kop oplevert). Maar als je de uitkomst kunt meten , werk je met een continue willekeurige variabele (bijvoorbeeld afmeting, lengte, gewicht, tijd, etc.)
Kansdichtheidsfuncties
Een waarschijnlijkheidsdichtheidsfunctie (pdf) vertelt ons de waarschijnlijkheid dat een willekeurige variabele een bepaalde waarde aanneemt.
Stel bijvoorbeeld dat we één keer met een dobbelsteen gooien. Als we x het getal laten aangeven waarop de dobbelstenen terechtkomen, dan kan de kansdichtheidsfunctie voor de uitkomst als volgt worden beschreven:
P(x < 1) : 0
P(x = 1) : 1/6
P(x = 2) : 1/6
P(x = 3) : 1/6
P(x = 4) : 1/6
P(x = 5) : 1/6
P(x = 6) : 1/6
P(x > 6) : 0
Merk op dat dit een voorbeeld is van een discrete willekeurige variabele, aangezien x alleen gehele waarden kan aannemen.
Voor een continue willekeurige variabele kunnen we een PDF niet rechtstreeks gebruiken, omdat de kans dat x een exacte waarde aanneemt nul is.
Stel dat we bijvoorbeeld de waarschijnlijkheid willen weten dat een hamburger van een bepaald restaurant een kwart pond (0,25 pond) weegt. Omdat gewicht een continue variabele is, kan het een oneindig aantal waarden aannemen.
Een bepaalde hamburger kan bijvoorbeeld in werkelijkheid 0,250001 pond wegen, of 0,24 pond, of 0,2488 pond. De kans dat een bepaalde hamburger precies 0,25 pond weegt, is in wezen nul.
Cumulatieve distributiefuncties
Een cumulatieve verdelingsfunctie (cdf) vertelt ons de waarschijnlijkheid dat een willekeurige variabele een waarde kleiner dan of gelijk aan x aanneemt.
Stel bijvoorbeeld dat we één keer met een dobbelsteen gooien. Als we x het getal laten aangeven waarop de dobbelstenen terechtkomen, dan kan de cumulatieve verdelingsfunctie van de uitkomst als volgt worden beschreven:
P(x ≤ 0) : 0
P(x ≤ 1) : 1/6
P(x ≤ 2) : 2/6
P(x ≤ 3) : 3/6
P(x ≤ 4) : 4/6
P(x ≤ 5) : 5/6
P(x ≤ 6) : 6/6
P(x > 6) : 0
Merk op dat de kans dat x kleiner is dan of gelijk is aan 6 6/6 is, wat gelijk is aan 1. Dit komt omdat de dobbelstenen met een waarschijnlijkheid van 100% op 1, 2, 3, 4, 5 of 6 terechtkomen.
In dit voorbeeld wordt een discrete willekeurige variabele gebruikt, maar een continue dichtheidsfunctie kan ook worden gebruikt voor een continue willekeurige variabele.
Cumulatieve verdelingsfuncties hebben de volgende eigenschappen:
- De kans dat een willekeurige variabele een waarde aanneemt die kleiner is dan de kleinst mogelijke waarde is nul. De kans dat een dobbelsteen op een waarde kleiner dan 1 terechtkomt, is bijvoorbeeld nul.
- De kans dat een willekeurige variabele een waarde aanneemt die kleiner is dan of gelijk is aan de grootst mogelijke waarde, is één. De kans dat een dobbelsteen op een waarde van 1, 2, 3, 4, 5 of 6 terechtkomt, is bijvoorbeeld één. Het moet op een van deze nummers terechtkomen.
- De cdf is altijd niet-afnemend. Dat wil zeggen: de kans dat een dobbelsteen valt op een getal kleiner dan of gelijk aan 1 is 1/6, de kans dat hij valt op een getal kleiner dan of gelijk aan 2 is 2/6, de kans dat hij valt op een getal kleiner dan of gelijk aan 1 is 1/6. getal kleiner dan of gelijk aan 3 is 3/6, enz. De cumulatieve kansen zijn altijd niet-afnemend.
Gerelateerd: U kunt een cirkeldiagram gebruiken om een cumulatieve verdelingsfunctie te visualiseren.
De relatie tussen een CDF en een PDF
In technische termen is een waarschijnlijkheidsdichtheidsfunctie (pdf) de afgeleide van een cumulatieve verdelingsfunctie (cdf).
Bovendien is het gebied onder de curve van een pdf tussen negatief oneindig en x gelijk aan de waarde van x op de cdf.
Voor een grondige uitleg van de relatie tussen een pdf en een cdf, evenals het bewijs waarom de pdf de afgeleide is van de cdf, raadpleegt u een statistiekhandboek.