Versteckte variablen: definition und beispiele


Eine versteckte Variable ist eine Variable, die nicht in eine statistische Analyse einbezogen wird, sich aber auf die Beziehung zwischen zwei Variablen innerhalb der Analyse auswirkt.

Eine versteckte Variable kann die wahre Beziehung zwischen Variablen verbergen oder fälschlicherweise den Eindruck erwecken, dass eine Beziehung zwischen Variablen besteht. Grundsätzlich können versteckte Variablen dazu führen, dass die Ergebnisse einer Studie irreführend sind.

Bei Beobachtungsstudien ist es wichtig, sich darüber im Klaren zu sein, dass versteckte Variablen zu ungewöhnlichen Interpretationen der Daten und Beziehungen zwischen Variablen führen können. Bei experimentellen Studien ist es wichtig, das Experiment so zu gestalten, dass das Risiko versteckter Variablen (so weit wie möglich) eliminiert wird.

Beispiele für versteckte Variablen

Die folgenden Beispiele veranschaulichen mehrere Fälle, in denen versteckte Variablen in einer Studie vorhanden sein könnten:

Beispiel 1

Forscher stellen fest, dass Eisverkauf und Hai-Angriffe stark positiv korrelieren. Bedeutet das, dass gestiegene Eisverkäufe zu mehr Hai-Angriffen führen?

Es ist unwahrscheinlich. Die wahrscheinlichste Ursache ist lauerndes wechselhaftes Wetter . Wenn es draußen wärmer ist, kaufen mehr Menschen Eis und mehr Menschen gehen ans Meer.

Beispiel 2

Ein Forscher entdeckt, dass der Popcornkonsum und die Anzahl der Verkehrsunfälle über die Jahre hinweg stark korrelieren. Bedeutet das, dass ein höherer Popcornkonsum mehr Verkehrsunfälle verursacht?

Es ist unwahrscheinlich. Die wahrscheinlichste Ursache ist die variable Lauerpopulation . Mit steigender Bevölkerungszahl steigt auch die Menge an konsumiertem Popcorn und die Zahl der Verkehrsunfälle.

Beispiel 3

Eine Studie kommt zu dem Ergebnis, dass der Schaden umso größer ist, je mehr Freiwillige sich nach einer Naturkatastrophe melden. Bedeutet das, dass Freiwillige mehr Schaden anrichten?

Es ist unwahrscheinlich. Die wahrscheinlichste Ursache ist das unterschiedliche Ausmaß der Naturkatastrophe . Eine größere Naturkatastrophe führt zu mehr Freiwilligen und einem Anstieg der durch die Naturkatastrophe verursachten Schäden.

Beispiel 4

Studie zeigt, dass Handschuhverkäufe und Snowboardunfälle eng miteinander korrelieren. Bedeutet das, dass Handschuhe mehr Snowboardunfälle verursachen?

Es ist unwahrscheinlich. Die wahrscheinlichste Ursache ist die lauernde Temperaturvariable . Wenn die Temperaturen sinken, kaufen immer mehr Menschen Handschuhe und immer mehr Menschen gehen Snowboarden.

So identifizieren Sie versteckte Variablen

Um verborgene Variablen aufzudecken, ist es hilfreich, über Fachwissen auf dem untersuchten Gebiet zu verfügen. Wenn Sie wissen, welche potenziellen Variablen die Beziehung zwischen Studienvariablen beeinflussen könnten, die nicht explizit in die Studie einbezogen werden, können Sie möglicherweise potenzielle versteckte Variablen aufdecken.

Eine weitere Möglichkeit, mögliche versteckte Variablen zu identifizieren, besteht darin, Residuendiagramme zu untersuchen. Wenn es einen Trend (linear oder nichtlinear) bei den Residuen gibt, könnte dies bedeuten, dass eine versteckte Variable, die nicht in die Studie einbezogen wird, die Studienvariablen in irgendeiner Weise beeinflusst.

So beseitigen Sie das Risiko versteckter Variablen

In Beobachtungsstudien kann es sehr schwierig sein, das Risiko versteckter Variablen auszuschließen. In den meisten Fällen besteht das Beste, was Sie tun können, darin, potenzielle versteckte Variablen, die sich auf die Studie auswirken könnten, einfach zu identifizieren, anstatt sie zu verhindern.

In experimentellen Studien kann der Einfluss versteckter Variablen jedoch durch ein gutes experimentelles Design weitgehend eliminiert werden.

Nehmen wir zum Beispiel an, wir möchten wissen, ob zwei Pillen einen unterschiedlichen Einfluss auf den Blutdruck haben. Wir wissen, dass auch versteckte Variablen wie Ernährung und Rauchgewohnheiten den Blutdruck beeinflussen. Wir können daher versuchen, diese verborgenen Variablen mithilfe einesrandomisierten Designs zu kontrollieren. Das bedeutet, dass wir den Patienten nach dem Zufallsprinzip entweder die erste oder die zweite Pille zuweisen.

Da wir Patienten nach dem Zufallsprinzip Gruppen zuordnen, können wir davon ausgehen, dass die versteckten Variablen beide Gruppen ungefähr gleich beeinflussen. Dies bedeutet, dass jeder Blutdruckunterschied auf die Pille und nicht auf die Wirkung einer versteckten Variablen zurückzuführen ist.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert