Wat is een gezamenlijke kansverdeling?
Een tweerichtingsfrequentietabel is een tabel die de frequenties (of „tellingen“) voor twee categorische variabelen weergeeft.
De volgende tweerichtingstabel toont bijvoorbeeld de resultaten van een onderzoek waarbij 100 mensen werd gevraagd welke sport zij het liefste beoefenen: honkbal, basketbal of voetbal.
De rijen geven het geslacht van de respondent weer en de kolommen geven de sport aan die hij kiest:
In dit voorbeeld zijn er twee variabelen: Sport en Geslacht.
Een gezamenlijke kansverdeling beschrijft eenvoudigweg de kans dat een bepaald individu twee specifieke waarden voor de variabelen aanneemt.
Het woord ‘conjunct’ komt voort uit het feit dat we geïnteresseerd zijn in de waarschijnlijkheid dat twee dingen tegelijkertijd gebeuren.
Op een totaal van 100 personen waren er bijvoorbeeld 13 mannen en kozen honkbal als hun favoriete sport.
We zouden dus zeggen dat de gezamenlijke waarschijnlijkheid dat een bepaald individu een man is en honkbal als favoriete sport kiest 13/100 = 0,13 of 13% is.
Geschreven in wiskundige notatie:
P(Geslacht = Man, Sport = Honkbal) = 13/100 = 0,13 .
We kunnen dit proces gebruiken om de volledige gezamenlijke kansverdeling te berekenen:
- P (Geslacht = Man, Sport = Honkbal) = 13/100 = 0,13
- P(Geslacht = Man, Sport = Basketbal) = 15/100 = 0,15
- P(Geslacht = Man, Sport = Voetbal) = 20/100 = 0,20
- P (Geslacht = Vrouw, Sport = Honkbal) = 23/100 = 0,23
- P(Geslacht = Vrouw, Sport = Basketbal) = 16/100 = 0,16
- P(Geslacht = Vrouw, Sport = Voetbal) = 13/100 = 0,13
Merk op dat de som van de kansen gelijk is aan 1 , oftewel 100% .
Waarom een gezamenlijke kansverdeling gebruiken?
Gezamenlijke kansverdelingen zijn nuttig omdat we vaak gegevens verzamelen voor twee variabelen (zoals sport en geslacht) en vragen willen beantwoorden die verband houden met beide variabelen.
We willen bijvoorbeeld graag inzicht krijgen in de waarschijnlijkheid dat een bepaald individu in een populatie een man is en honkbal als favoriete sport verkiest.
Of misschien zijn we geïnteresseerd in het begrijpen van de waarschijnlijkheid dat een bepaald individu een vrouw is en voetbal als favoriete sport verkiest.
Een gezamenlijke kansverdeling kan ons helpen deze vragen te beantwoorden.
Gebruik de volgende voorbeelden als oefening om gezamenlijke kansverdelingen beter te begrijpen.
voorbeeld 1
De volgende tabel geeft de resultaten weer van een enquête waarin 238 mensen werd gevraagd naar wat voor soort film ze de voorkeur gaven:
Vraag: Hoe groot is de kans dat een bepaald individu een vrouw is en de voorkeur geeft aan drama als haar favoriete filmgenre?
Antwoord: P (Gender = Vrouw, Geslacht = Drama) = 58/238 = 0,244 = 24,4%
Voorbeeld 2
De volgende tweerichtingstabel toont de examenscores van 64 studenten in een klas op basis van het aantal uren dat ze hebben gestudeerd:
Vraag: Wat is de kans dat een gegeven individu 2 uur studeert en een cijfer tussen 91 en 100 krijgt?
Antwoord: P (Studie = 2 uur, Score = 91-100) = 3/64 = 0,047 = 4,7%
Aanvullende bronnen
Wat is een marginale verdeling?
Hoe u de voorwaardelijke relatieve frequentie kunt vinden in een tabel met dubbele invoer