So führen sie hypothesentests in python durch (mit beispielen)


Ein Hypothesentest ist ein formaler statistischer Test, den wir verwenden, um eine statistische Hypothese abzulehnen oder nicht abzulehnen.

In diesem Tutorial wird erläutert, wie Sie die folgenden Hypothesentests in Python durchführen:

  • Ein Beispiel-T-Test
  • T-Test bei zwei Stichproben
  • T-Test für gepaarte Stichproben

Lass uns gehen!

Beispiel 1: Ein Beispiel für einen t-Test in Python

Ein T-Test bei einer Stichprobe wird verwendet, um zu testen, ob der Mittelwert einer Grundgesamtheit einem bestimmten Wert entspricht oder nicht.

Nehmen wir zum Beispiel an, wir möchten wissen, ob das Durchschnittsgewicht einer bestimmten Schildkrötenart 310 Pfund beträgt oder nicht.

Um dies zu testen, sammeln wir eine einfache Zufallsstichprobe von Schildkröten mit den folgenden Gewichten:

Gewicht : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303

Der folgende Code zeigt, wie Sie die Funktion ttest_1samp() in der Bibliothek scipy.stats verwenden, um einen t-Test mit einer Stichprobe durchzuführen:

 import scipy.stats as stats

#define data
data = [300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303]

#perform one sample t-test
stats. ttest_1samp (a=data, popmean= 310 )

Ttest_1sampResult(statistic=-1.5848116313861254, pvalue=0.1389944275158753)

Die T-Test-Statistik beträgt -1,5848 und der entsprechende zweiseitige p-Wert beträgt 0,1389 .

Die beiden Hypothesen für diesen t-Test für eine bestimmte Stichprobe lauten wie folgt:

  • H 0 : µ = 310 (das durchschnittliche Gewicht dieser Schildkrötenart beträgt 310 Pfund)
  • H A : µ ≠310 (Durchschnittsgewicht beträgt nicht 310 Pfund)

Da der p-Wert unseres Tests (0,1389) größer als Alpha = 0,05 ist, können wir die Nullhypothese des Tests nicht ablehnen.

Wir haben keine ausreichenden Beweise dafür, dass das Durchschnittsgewicht dieser besonderen Schildkrötenart etwas anderes als 310 Pfund beträgt.

Beispiel 2: T-Test bei zwei Stichproben in Python

Ein T-Test mit zwei Stichproben wird verwendet, um zu testen, ob die Mittelwerte zweier Grundgesamtheiten gleich sind oder nicht.

Angenommen, wir möchten wissen, ob das Durchschnittsgewicht zweier verschiedener Schildkrötenarten gleich ist oder nicht.

Um dies zu testen, sammeln wir eine einfache Zufallsstichprobe von Schildkröten jeder Art mit den folgenden Gewichten:

Probe 1 : 300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303

Probe 2 : 335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305

Der folgende Code zeigt, wie Sie die Funktion ttest_ind() in der Bibliothek scipy.stats verwenden, um diese beiden T-Test-Beispiele durchzuführen:

 import scipy. stats as stats

#define array of turtle weights for each sample
sample1 = [300, 315, 320, 311, 314, 309, 300, 308, 305, 303, 305, 301, 303]
sample2 = [335, 329, 322, 321, 324, 319, 304, 308, 305, 311, 307, 300, 305]

#perform two sample t-tests
stats. ttest_ind (a=sample1, b=sample2) 

Ttest_indResult(statistic=-2.1009029257555696, pvalue=0.04633501389516516)

Die T-Test-Statistik beträgt –2,1009 und der entsprechende zweiseitige p-Wert beträgt 0,0463 .

Die beiden Annahmen für diesen speziellen T-Test bei zwei Stichproben sind:

  • H 0 : µ 1 = µ 2 (das durchschnittliche Gewicht zwischen den beiden Arten ist gleich)
  • H A : µ 1 ≠ µ 2 (das durchschnittliche Gewicht zwischen den beiden Arten ist nicht gleich)

Da der p-Wert des Tests (0,0463) kleiner als 0,05 ist, lehnen wir die Nullhypothese ab.

Das bedeutet, dass wir genügend Beweise dafür haben, dass das Durchschnittsgewicht der beiden Arten nicht gleich ist.

Beispiel 3: T-Test für gepaarte Stichproben in Python

Ein t-Test für gepaarte Stichproben wird verwendet, um die Mittelwerte zweier Stichproben zu vergleichen, wenn jede Beobachtung in einer Stichprobe mit einer Beobachtung in der anderen Stichprobe verknüpft werden kann.

Nehmen wir zum Beispiel an, wir möchten wissen, ob ein bestimmtes Trainingsprogramm in der Lage ist, den maximalen vertikalen Sprung (in Zoll) von Basketballspielern zu steigern.

Um dies zu testen, können wir eine einfache Zufallsstichprobe von 12 College-Basketballspielern rekrutieren und jeden ihrer maximalen vertikalen Sprünge messen. Dann können wir jeden Spieler einen Monat lang das Trainingsprogramm anwenden lassen und dann am Ende des Monats erneut seinen maximalen vertikalen Sprung messen.

Die folgenden Daten zeigen die maximale Sprunghöhe (in Zoll) vor und nach der Verwendung des Trainingsprogramms für jeden Spieler:

Vorderseite : 22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21

Nachher : 23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20

Der folgende Code zeigt, wie Sie die Funktion ttest_rel() in der Bibliothek scipy.stats verwenden, um diesen T-Test für gepaarte Stichproben durchzuführen:

 import scipy. stats as stats

#define before and after max jump heights
before = [22, 24, 20, 19, 19, 20, 22, 25, 24, 23, 22, 21]
after = [23, 25, 20, 24, 18, 22, 23, 28, 24, 25, 24, 20]

#perform paired samples t-test
stats. ttest_rel (a=before, b=after)

Ttest_relResult(statistic=-2.5289026942943655, pvalue=0.02802807458682508)

Die T-Test-Statistik beträgt –2,5289 und der entsprechende zweiseitige p-Wert beträgt 0,0280 .

Die beiden Annahmen für diesen speziellen T-Test für gepaarte Stichproben sind:

  • H 0 : µ 1 = µ 2 (die durchschnittliche Höhe des Sprunges vor und nach der Verwendung des Programms ist gleich)
  • H A : µ 1 ≠ µ 2 (die durchschnittliche Höhe des Sprunges vor und nach der Verwendung des Programms ist nicht gleich)

Da der p-Wert des Tests (0,0280) kleiner als 0,05 ist, lehnen wir die Nullhypothese ab.

Das bedeutet, dass wir genügend Beweise dafür haben, dass die durchschnittliche Sprunghöhe vor und nach der Anwendung des Trainingsprogramms nicht gleich ist.

Zusätzliche Ressourcen

Mit den folgenden Online-Rechnern können Sie verschiedene T-Tests automatisch durchführen:

Ein Beispiel für einen T-Test-Rechner
T-Test-Rechner für zwei Stichproben
T-Test-Rechner für gepaarte Stichproben

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert