Zmienne jakościowe i ilościowe: jaka jest różnica?
W statystyce wyróżnia się dwa typy zmiennych:
1. Zmienne ilościowe: Czasami nazywane zmiennymi „numerycznymi”. Są to zmienne, które reprezentują mierzalną wielkość. Przykłady obejmują:
- Liczba uczniów w klasie
- Liczba metrów kwadratowych w domu
- Wielkość populacji miasta
- Wiek osobnika
- Rozmiar osobnika
2. Zmienne jakościowe: czasami nazywane zmiennymi „kategorycznymi”. Są to zmienne, które przyjmują nazwy lub etykiety i można je przypisać do kategorii. Przykłady obejmują:
- Kolor oczu (np. „niebieski”, „zielony”, „brązowy”)
- Płeć (np. „mężczyzna”, „kobieta”)
- Rasa psa (np. „laboratorium”, „buldog”, „pudel”)
- Poziom wykształcenia (np. „liceum”, „stopień inżyniera”, „licencjat”)
- Stan cywilny (np. „żonaty”, „panny”, „rozwiedziony”)
Każdą zmienną, którą spotkasz w statystyce, można sklasyfikować jako ilościową lub jakościową.
Przykład: Klasyfikacja zmiennych ilościowych i jakościowych
Rozważmy następujący zbiór danych zawierający informacje o 10 różnych koszykarzach:
W tym zbiorze danych znajduje się łącznie pięć zmiennych. Dwie z nich to zmienne jakościowe, a trzy z nich to zmienne ilościowe:
Podsumuj zmienne ilościowe i jakościowe
Do podsumowania zmiennych ilościowych możemy użyć wielu różnych miar, w tym:
- Miary tendencji centralnej, takie jak średnia, mediana i moda.
- Miary rozproszenia, takie jak rozstęp, rozstęp międzykwartylowy i odchylenie standardowe.
Jednak do podsumowania zmiennych jakościowych możemy używać jedynie tabel częstości i tabel częstotliwości względnych.
Aby to zilustrować, rozważmy ponownie zbiór danych z poprzedniego przykładu:
Dla zmiennej ilościowej „Rozegrane sezony” możemy obliczyć następujące metryki:
- Średnia: 11,5
- Mediana: 12
- Tryby: 12
- Zasięg: 8
- Skala międzykwartylowa: 4,5
- Odchylenie standardowe: 2,915
Metryki te dają nam dobre pojęcie o tym, gdzie znajduje się wartość centralna, a także o rozkładzie wartości tej zmiennej.
Natomiast dla zmiennej jakościowej Pozycja możemy stworzyć tabelę częstości opisującą jak często pojawiają się różne wartości:
Ta tabela pozwala nam szybko sprawdzić, jak często każda pozycja (L=osłona, F=naprzód, C=środek) występowała w zbiorze danych.
Dodatkowe zasoby
Statystyki opisowe lub wnioskowane
Statystyki a parametry
Poziomy pomiaru: nominalny, porządkowy, interwałowy i ilorazowy