Wat is geheugenloos eigendom? (definitie & #038; voorbeeld)
In de statistiek wordt gezegd dat een kansverdeling een geheugenloze eigenschap heeft als de waarschijnlijkheid dat een toekomstige gebeurtenis plaatsvindt niet wordt beïnvloed door het optreden van gebeurtenissen uit het verleden.
Er zijn slechts twee kansverdelingen met de geheugenloze eigenschap:
- De exponentiële verdeling met niet-negatieve reële getallen.
- De geometrische verdeling met niet-negatieve gehele getallen.
Deze twee waarschijnlijkheidsverdelingen worden gebruikt om de verwachte tijd voordat een gebeurtenis plaatsvindt te modelleren.
Het blijkt dat weten hoeveel tijd er al is verstreken ons op geen enkel moment vertelt of de kans groter is dat een gebeurtenis vroeg of laat zal plaatsvinden.
De volgende voorbeelden helpen ons een betere intuïtie te krijgen van de geheugenloze eigenschap.
Een intuïtie van eigendom zonder geheugen
Beschouw de volgende voorbeelden:
Niet zonder geheugen
Het is bekend dat een bepaald merk laptops gemiddeld zo’n 6 jaar meegaat voordat het doodgaat. Dus als we weten dat een bepaalde laptop vijf jaar oud is, is de verwachte tijd voordat deze kapot gaat vrij kort. Als een andere laptop echter slechts 1 jaar oud is, is de verwachte tijd voordat deze kapot gaat behoorlijk lang.
In dit voorbeeld weten we hoeveel tijd er is verstreken tijdens de levensduur van elke laptop, hoe lang de laptop zal blijven werken totdat hij sterft. Deze kansverdeling zou dus geen eigenschap hebben zonder geheugen.
Zonder geheugen
Ik vermoed dat Jessica een buurtwinkel heeft. Ze wil weten hoe lang ze moet wachten tot de volgende klant de winkel binnenkomt.
In dit voorbeeld is het niet echt handig om te weten wanneer de laatste klant de winkel binnenkwam om te voorspellen wanneer de volgende klant binnenkomt, omdat elke klant onafhankelijk is en individueel gedrag vertoont.
Deze kansverdeling zou dus een geheugenloze eigenschap hebben. Met andere woorden: de waarschijnlijkheid dat een toekomstige gebeurtenis zich voordoet, wordt niet beïnvloed door het optreden van gebeurtenissen uit het verleden.
De geheugenloze eigenschap: een formele definitie
In formele statistische termen wordt gezegd dat een willekeurige variabele X een waarschijnlijkheidsverdeling volgt met een geheugenloze eigenschap voor a en b in {0, 1, 2, …} is het waar dat:
Pr(X > een + b | X ≥ a ) = Pr(X > b )
Stel dat we bijvoorbeeld een waarschijnlijkheidsverdeling hebben met een geheugenloze eigenschap en X is het aantal pogingen tot het eerste succes. Als a = 30 en b = 10 dan zouden we zeggen:
- Pr(X > een + b | X ≥ a ) = Pr(X > b )
- Pr(X > 30 + 10 | X ≥ 30 ) = Pr(X > 10)
- Pr(X > 40 | X ≥ 30 ) = Pr(X > 10)
Met andere woorden: als we 30 mislukte pogingen hebben gehad, dan is de kans dat we zullen moeten wachten tot proef #40 of later om succes te ervaren hetzelfde als de kans om helemaal opnieuw te beginnen en te wachten tot proef #10. of meer om succesvol te zijn.
Omdat deze kansverdeling een geheugenloze eigenschap heeft, betekent dit dat het kennen van het aantal mislukkingen dat we tot een bepaald punt hebben gehad ons nog steeds niets vertelt over de waarschijnlijkheid van falen in de toekomst.
De geheugenloze eigenschap: een voorbeeld
Stel dat gemiddeld 30 klanten per uur een winkel binnenkomen en dat de tijd tussen aankomsten exponentieel verdeeld is. Tussen opeenvolgende bezoeken zitten gemiddeld 2 minuten.
Er wordt van uitgegaan dat er 10 minuten zijn verstreken sinds de laatste klant arriveerde. Aangezien dit een ongewoon lange periode is, lijkt het waarschijnlijker dat er binnen een minuut een klant arriveert.
Omdat de exponentiële verdeling echter een geheugenloze eigenschap heeft, blijkt dit niet het geval te zijn. De tijd die wordt besteed aan het wachten op de volgende klant is niet afhankelijk van de tijd sinds de laatste klant arriveerde.
We kunnen dit bewijzen met behulp van de CDF van de exponentiële verdeling:
CDF: 1 – e -λx
waarbij λ wordt berekend als 1/gemiddelde tussenaankomsttijd. In ons voorbeeld is λ = 1/2 = 0,5.
Als we a = 10 en b = 1 instellen, dan krijgen we:
- Pr(X > een + b | X ≥ a ) = Pr(X > b )
- Pr( X > 10 + 1 |
Ongeacht hoeveel tijd er is verstreken sinds de laatste klant arriveerde, is de kans dat het meer dan een minuut duurt voordat de volgende aankomst arriveert 0,6065 .