Qualitative und quantitative variablen: was ist der unterschied?
In der Statistik gibt es zwei Arten von Variablen:
1. Quantitative Variablen: Manchmal auch „numerische“ Variablen genannt. Hierbei handelt es sich um Variablen, die eine messbare Größe darstellen. Beispiele beinhalten:
- Anzahl der Schüler einer Klasse
- Anzahl der Quadratmeter in einem Haus
- Bevölkerungsgröße einer Stadt
- Alter einer Person
- Größe einer Person
2. Qualitative Variablen: Manchmal auch „kategoriale“ Variablen genannt. Hierbei handelt es sich um Variablen, die Namen oder Bezeichnungen annehmen und in Kategorien passen können. Beispiele beinhalten:
- Augenfarbe (z. B. „blau“, „grün“, „braun“)
- Geschlecht (z. B. „Mann“, „Frau“)
- Hunderasse (z. B. „Labor“, „Bulldogge“, „Pudel“)
- Bildungsniveau (z. B. „High School“, „Associate Degree“, „Bachelor-Abschluss“)
- Familienstand (z. B. „verheiratet“, „ledig“, „geschieden“)
Jede Variable, die Ihnen in der Statistik begegnet, kann als quantitativ oder qualitativ klassifiziert werden.
Beispiel: Klassifizierung quantitativer und qualitativer Variablen
Betrachten Sie den folgenden Datensatz mit Informationen zu 10 verschiedenen Basketballspielern:
Insgesamt gibt es in diesem Datensatz fünf Variablen. Zwei davon sind qualitative Variablen und drei davon sind quantitative Variablen:
Fassen Sie quantitative und qualitative Variablen zusammen
Wir können viele verschiedene Maße verwenden, um quantitative Variablen zusammenzufassen, darunter:
- Maße der zentralen Tendenz wie Mittelwert, Median und Modus.
- Streuungsmaße wie Reichweite, Interquartilbereich und Standardabweichung.
Wir können jedoch nur Häufigkeitstabellen und relative Häufigkeitstabellen verwenden, um qualitative Variablen zusammenzufassen.
Um dies zu veranschaulichen, betrachten Sie noch einmal den Datensatz aus dem vorherigen Beispiel:
Für die quantitative Variable „Seasons Played“ können wir die folgenden Metriken berechnen:
- Durchschnitt: 11,5
- Median: 12
- Modi: 12
- Bereich: 8
- Interquartilskala: 4,5
- Standardabweichung: 2,915
Diese Metriken geben uns eine gute Vorstellung davon, wo sich der zentrale Wert befindet und wie die Werte für diese Variable verteilt sind.
Und für die qualitative Variable Position können wir eine Häufigkeitstabelle erstellen, um zu beschreiben, wie oft verschiedene Werte auftreten:
Anhand dieser Tabelle können wir schnell erkennen, wie oft jede Position (L=Guard, F=Forward, C=Center) im Datensatz vorkam.
Zusätzliche Ressourcen
Beschreibende oder inferenzielle Statistik
Statistiken vs. Parameter
Messniveaus: nominal, ordinal, Intervall und Verhältnis