Categorische variabele
In dit artikel wordt uitgelegd wat categorische variabelen zijn. Daarom vindt u de betekenis van categorische variabelen in de statistieken, voorbeelden van categorische variabelen en wat de verschillende soorten categorische variabelen zijn.
Wat is een categorische variabele?
In de statistiek is een categorische variabele een type variabele dat slechts een beperkt aantal waarden toestaat. Met andere woorden: een categorische variabele heeft een eindig aantal mogelijke waarden.
Bovendien vertegenwoordigt elke waarde van een categorische variabele een kwaliteit of categorie.
Geslacht is bijvoorbeeld een categorische variabele omdat het alleen ‘mannelijk’ of ‘vrouwelijk’ kan zijn.
Categorische variabelen kunnen ook kwalitatieve variabelen worden genoemd, omdat elke waarde van de variabele geassocieerd is met een kwaliteit of kenmerk.
Voorbeelden van categorische variabelen
Nu we de definitie van een categorische variabele kennen, gaan we een aantal voorbeelden van dit soort statistische variabelen bekijken om het concept beter te begrijpen.
- De burgerlijke staat van een persoon : hij of zij kan “getrouwd”, “vrijgezel”, “gescheiden” zijn…
- Iemands beroep : dit kan “econoom”, “computerwetenschapper”, “kapper”… zijn
- Het resultaat van een experiment : het kan een “succes” of een “mislukking” zijn.
- De kleur van de broek : er zijn veel kleuren, maar het is een eindig getal, zoals “rood”, “blauw”, “groen”…
- Het economische niveau van een persoon : hij of zij kan worden geclassificeerd als ‘arm’, ‘middenklasse’ of ‘rijk’.
- Welke hand is dominant : Een persoon kan ‘rechts’, ‘linkshandig’ of ‘tweehandig’ zijn.
- Het type huis waarin een persoon woont : dit kan “appartement”, “duplex”, “huis”, “herenhuis” zijn…
- Het resultaat van een gelijkspel : er kan alleen maar “kop” of “munt” zijn.
Soorten categorische variabelen
Er zijn drie soorten categorische variabelen :
- Nominale variabele : het is een categorische variabele die geen enkele volgorde volgt, dat wil zeggen dat de waarden die hij kan aannemen geen enkele hiërarchie vertonen. Bijvoorbeeld: de burgerlijke staat van een persoon (alleenstaand, getrouwd, gescheiden, enz.).
- Ordinale variabele – Dit is een type categorische variabele waarvan de mogelijke waarden kunnen worden geordend. Bijvoorbeeld de sportmedaille (goud, zilver en brons).
- Dichotome variabele (of binaire variabele) : het is een categorische variabele die slechts twee mogelijke waarden toelaat. Bijvoorbeeld: geslacht (man of vrouw).
Categorische variabele en numerieke variabele
In algemene termen kan elk type statistische variabele worden geclassificeerd als een categorische variabele of een numerieke variabele, hoewel elk type vervolgens zijn eigen subtypes van variabelen toestaat. Daarom zullen we in deze sectie zien hoe we een categorische variabele kunnen onderscheiden van een numerieke variabele.
Een numerieke variabele is een variabele die alleen numerieke waarden accepteert. De lengte van een persoon kan bijvoorbeeld 1,74 m, 1,83 m, 1,59 m, enz. Zijn. maar het kan alleen een getal zijn, een hoogte kan geen categorie zijn.
Het onderscheiden van een categorische variabele van een numerieke variabele is dus relatief eenvoudig, je hoeft alleen maar te kijken of de mogelijke waarden categorieën of getallen zijn. Als de waarden categorieën of kwaliteiten zijn, is het een categorische variabele. Als de waarden daarentegen numeriek zijn, is het een numerieke variabele.