Ukryte zmienne: definicja i przykłady
Zmienna ukryta to zmienna, która nie jest uwzględniana w analizie statystycznej, ale wpływa na relację między dwiema zmiennymi w ramach analizy.
Ukryta zmienna może ukryć prawdziwy związek między zmiennymi lub może fałszywie sprawiać wrażenie, że między zmiennymi istnieje związek. Zasadniczo ukryte zmienne mogą sprawić, że wyniki badania będą mylące.
W badaniach obserwacyjnych należy mieć świadomość, że zmienne ukryte mogą prowadzić do nietypowych interpretacji danych i zależności między zmiennymi. W badaniach eksperymentalnych ważne jest zaprojektowanie eksperymentu w sposób eliminujący (w miarę możliwości) ryzyko wystąpienia zmiennych ukrytych.
Przykłady ukrytych zmiennych
Poniższe przykłady ilustrują kilka przypadków, w których w badaniu mogą występować zmienne ukryte:
Przykład 1
Badacz odkrył, że sprzedaż lodów i ataki rekinów są silnie skorelowane. Czy to oznacza, że zwiększona sprzedaż lodów powoduje więcej ataków rekinów?
Jest mało prawdopodobne. Najbardziej prawdopodobną przyczyną jest czyhająca zmienna pogoda . Kiedy na zewnątrz jest cieplej, więcej osób kupuje lody i więcej osób wybiera się nad ocean.
Przykład 2
Badacz odkrywa, że spożycie popcornu i liczba wypadków drogowych na przestrzeni lat są ze sobą silnie powiązane. Czy to oznacza, że większe spożycie popcornu powoduje więcej wypadków drogowych?
Jest mało prawdopodobne. Najbardziej prawdopodobną przyczyną jest zmienna czyhająca populacja . Wraz ze wzrostem populacji wzrasta ilość spożywanego popcornu i liczba wypadków drogowych.
Przykład 3
Z badania wynika, że im więcej ochotników zgłasza się po klęsce żywiołowej, tym większe są szkody. Czy to oznacza, że ochotnicy wyrządzają więcej szkód?
Jest mało prawdopodobne. Najbardziej prawdopodobną przyczyną jest różna skala klęski żywiołowej . Większa klęska żywiołowa skutkuje większą liczbą wolontariuszy, a także wzrostem wielkości szkód spowodowanych klęską żywiołową.
Przykład 4
Badanie wykazało, że sprzedaż rękawiczek i wypadki na snowboardzie są silnie powiązane. Czy to oznacza, że rękawiczki powodują więcej wypadków na snowboardzie?
Jest mało prawdopodobne. Najbardziej prawdopodobną przyczyną jest czyhająca zmienna temperatura . Wraz ze spadkiem temperatury coraz więcej osób kupuje rękawiczki i coraz więcej osób jeździ na snowboardzie.
Jak zidentyfikować ukryte zmienne
Aby odkryć ukryte zmienne, pomocne jest posiadanie wiedzy specjalistycznej w badanej dziedzinie. Wiedząc, jakie potencjalne zmienne mogą wpłynąć na związek między zmiennymi badania, które nie zostały wyraźnie uwzględnione w badaniu, możesz odkryć potencjalne zmienne ukryte.
Innym sposobem identyfikacji potencjalnych zmiennych ukrytych jest zbadanie wykresów reszt. Jeśli w resztach występuje trend (liniowy lub nieliniowy), może to oznaczać, że zmienna ukryta nieuwzględniona w badaniu w jakiś sposób wpływa na zmienne badania.
Jak wyeliminować ryzyko ukrytych zmiennych
W badaniach obserwacyjnych wyeliminowanie ryzyka ukrytych zmiennych może być bardzo trudne. W większości przypadków najlepsze, co można zrobić, to po prostu zidentyfikować, a nie zapobiegać potencjalnym ukrytym zmiennym, które mogą mieć wpływ na badanie.
Jednakże w badaniach eksperymentalnych wpływ zmiennych ukrytych można w dużej mierze wyeliminować poprzez dobry projekt eksperymentu.
Załóżmy na przykład, że chcemy wiedzieć, czy dwie pigułki mają różny wpływ na ciśnienie krwi. Wiemy, że ukryte zmienne, takie jak dieta i nawyki palenia, również wpływają na ciśnienie krwi. Możemy zatem próbować kontrolować te ukryte zmienne, stosując projekt losowy . Oznacza to, że losowo przydzielamy pacjentów do przyjęcia pierwszej lub drugiej pigułki.
Ponieważ losowo przypisujemy pacjentów do grup, możemy założyć, że ukryte zmienne będą miały w przybliżeniu taki sam wpływ na obie grupy. Oznacza to, że każdą różnicę w ciśnieniu krwi można przypisać pigułce, a nie działaniu ukrytej zmiennej.