Contingentietabel
In dit artikel wordt uitgelegd wat kruistabellen zijn, hoe u een kruistabel maakt en waarvoor dit soort tabellen worden gebruikt. Daarnaast vindt u een concreet voorbeeld van het berekenen van kansen uit een kruistabel.
Wat is een kruistabel?
Een kruistabel is een reeks rijen en kolommen die worden gebruikt om verzamelde gegevens te classificeren. In de statistieken worden contingentietabellen gebruikt om kansen te berekenen en de verzamelde informatie te analyseren.
Om te laten zien wat een kruistabel is, volgt hier een voorbeeld van de resultaten van de wedstrijden die een voetbalteam gedurende een heel seizoen heeft gespeeld, uitgedrukt in een kruistabel:
Zoals u kunt zien, zijn contingentietabellen erg handig voor het stratificeren van gegevens. Dankzij deze contingentietabel weten we bijvoorbeeld dat het team 19 wedstrijden won van de 25 die ze thuis speelden, daarnaast speelden ze in totaal 50 wedstrijden.
Daarom is het maken van een kruistabel heel eenvoudig: u moet eerst onderzoek doen en numerieke gegevens verzamelen over het onderwerp in kwestie. Sorteer vervolgens eenvoudig de gegevens op basis van hun aard. Logischerwijs moet je heel duidelijk zijn over de variabelen waarmee je de gegevens wilt classificeren om een correcte interpretatie te kunnen maken.
Momenteel zijn er veel computerprogramma’s, zoals Excel of Minitab, die automatisch kruistabellen maken, dat wil zeggen dat u alleen maar de gegevens in de computer hoeft in te voeren en de variabelen in de tabel uitspreekt. Dit programma kan gegevens in een kruistabel en voer statistische berekeningen uit.
Voorbeeld van een kruistabel
Zodra we de definitie van een kruistabel kennen, zullen we een opgeloste oefening zien om het concept beter te begrijpen.
In de onderstaande kruistabel zijn de resultaten van alle wedstrijden van een voetbalteam gedurende een heel seizoen verzameld. Bereken op basis van deze informatie de volgende kansen:
- Wat is voor een bepaalde wedstrijd de marginale kans dat het team verliest?
- Wat is de gezamenlijke kans om uit te spelen en te winnen?
- Wat is de voorwaardelijke kans (of voorwaardelijke kans) om te winnen als je thuis speelt?
De kruistabel voor deze oefening is 2×2, omdat deze twee rijen en twee kolommen heeft.
Om een waarschijnlijkheid te berekenen, moet het aantal gevallen dat gunstig is voor de gebeurtenis worden gedeeld door het totale aantal mogelijke gevallen, dat wil zeggen dat de formule voor het berekenen van de kansen is:
Dus voor de eerste vraag, het berekenen van de marginale waarschijnlijkheid van een nederlaag, moeten we het aantal waargenomen nederlagen (20) delen door het totale aantal wedstrijden (50):
Ten tweede, om de gezamenlijke kans te vinden dat wegspelen en winnen tegelijkertijd plaatsvinden, moet je het aantal overwinningen dat plaatsvond tijdens het wegspelen (11) delen door het totale aantal gevallen (50):
Om ten slotte de voorwaardelijke kans te bepalen dat het team wint als het thuis speelt, moeten we het quotiënt berekenen tussen het aantal thuisoverwinningen (19) en het totaal aantal thuisgespeelde wedstrijden (25):
Merk op dat de berekening van kansen niet altijd op dezelfde manier gebeurt, aangezien de noemer van de formule (het totale aantal gevallen) varieert afhankelijk van het type waarschijnlijkheid .
Waar wordt een kruistabel voor gebruikt?
In dit laatste gedeelte zullen we zien waarvoor kruistabellen worden gebruikt, aangezien ze erg nuttig zijn in statistieken en waarschijnlijkheid.
In de eerste plaats wordt een kruistabel gebruikt om gegevens voor een categorische variabele te analyseren. Het is moeilijk om statistisch onderzoek te doen naar dit soort variabelen, maar door gebruik te maken van contingentietabellen kunnen de gegevens duidelijk worden geordend en dus gemakkelijker worden geïnterpreteerd.
Zoals we in het bovenstaande voorbeeld hebben gezien, is het heel praktisch om kansen te berekenen op basis van een kruistabel; je hoeft alleen maar duidelijke concepten te hebben en de juiste gegevens in de formule te vervangen.
Bovendien maken contingentietabellen het gemakkelijker om relaties tussen variabelen in een onderzoek af te leiden door ze simpelweg te observeren, omdat ze gegevens op een ordelijke en duidelijke manier presenteren.