So führen sie einen t-test mit zwei stichproben in python durch


Ein T-Test mit zwei Stichproben wird verwendet, um zu testen, ob die Mittelwerte zweier Grundgesamtheiten gleich sind oder nicht.

In diesem Tutorial wird erläutert, wie Sie in Python einen T-Test mit zwei Stichproben durchführen.

Beispiel: zwei T-Test-Beispiele in Python

Forscher wollen wissen, ob zwei verschiedene Pflanzenarten die gleiche durchschnittliche Höhe haben. Um dies zu testen, sammeln sie eine einfache Zufallsstichprobe von 20 Pflanzen jeder Art.

Befolgen Sie die folgenden Schritte, um einen T-Test bei zwei Stichproben durchzuführen und festzustellen, ob die beiden Pflanzenarten die gleiche Höhe haben.

Schritt 1: Erstellen Sie die Daten.

Zuerst erstellen wir zwei Tabellen, um die Messungen für jede Gruppe von 20 Pflanzen zu speichern:

 import numpy as np

group1 = np.array([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15, 16, 16, 13, 14, 12])
group2 = np.array([15, 17, 14, 17, 14, 8, 12, 19, 19, 14, 17, 22, 24, 16, 13, 16, 13, 18, 15, 13])

Schritt 2: Führen Sie einen T-Test bei zwei Stichproben durch.

Als Nächstes verwenden wir die Funktion ttest_ind() aus der Bibliothek scipy.stats, um einen T-Test mit zwei Beispielen durchzuführen, der die folgende Syntax verwendet:

ttest_ind(a, b, equal_var=True)

Gold:

  • a: eine Tabelle mit Beispielbeobachtungen für Gruppe 1
  • b: eine Tabelle mit Beispielbeobachtungen für Gruppe 2
  • equal_var: Wenn „true“, führen Sie einen standardmäßigen unabhängigen t-Test bei zwei Stichproben durch, der gleiche Populationsvarianzen annimmt. Wenn dies nicht der Fall ist, führen Sie den Welch-T-Test durch, der nicht von gleichen Populationsvarianzen ausgeht. Dies ist standardmäßig der Fall.

Bevor wir den Test durchführen, müssen wir entscheiden, ob wir davon ausgehen, dass die beiden Populationen gleiche Varianzen aufweisen. Im Allgemeinen können wir davon ausgehen, dass Populationen gleiche Varianzen aufweisen, wenn das Verhältnis der größten Stichprobenvarianz zur kleinsten Stichprobenvarianz weniger als 4:1 beträgt.

 #find variance for each group
print(np.var(group1), np.var(group2))

7.73 12.26

Das Verhältnis der größten Stichprobenvarianz zur kleinsten Stichprobenvarianz beträgt 12,26/7,73 = 1,586 , was weniger als 4 ist. Das bedeutet, dass wir davon ausgehen können, dass die Varianzen der Grundgesamtheit gleich sind.

Somit können wir mit der Durchführung des t-Tests bei zwei Stichproben mit gleichen Varianzen fortfahren:

 import scipy.stats as stats

#perform two sample t-test with equal variances
stats.ttest_ind(a=group1, b=group2, equal_var=True)

(statistic=-0.6337, pvalue=0.53005)

Die T-Test-Statistik beträgt -0,6337 und der entsprechende zweiseitige p-Wert beträgt 0,53005 .

Schritt 3: Interpretieren Sie die Ergebnisse.

Die beiden Annahmen für diesen speziellen T-Test bei zwei Stichproben sind:

H 0 : µ 1 = µ 2 (die beiden Populationsmittelwerte sind gleich)

H A : µ 1 ≠µ 2 (die beiden Populationsmittelwerte sind nicht gleich)

Da der p-Wert unseres Tests (0,53005) größer als Alpha = 0,05 ist, können wir die Nullhypothese des Tests nicht ablehnen. Wir haben keine ausreichenden Beweise dafür, dass die durchschnittliche Pflanzenhöhe zwischen den beiden Populationen unterschiedlich ist.

Zusätzliche Ressourcen

So führen Sie einen T-Test bei einer Stichprobe in Python durch
So führen Sie einen T-Test für gepaarte Stichproben in Python durch

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert