Jak wykonać test t dla dwóch próbek w pythonie


Test t dla dwóch prób służy do sprawdzenia, czy średnie z dwóch populacji są równe, czy nie.

W tym samouczku wyjaśniono, jak wykonać test t dla dwóch próbek w języku Python.

Przykład: dwa przykłady testu t w Pythonie

Naukowcy chcą wiedzieć, czy dwa różne gatunki roślin mają tę samą średnią wysokość. Aby to sprawdzić, zbierają prostą losową próbkę 20 roślin każdego gatunku.

Wykonaj poniższe kroki, aby przeprowadzić test t dla dwóch próbek w celu ustalenia, czy oba gatunki roślin mają tę samą wysokość.

Krok 1: Utwórz dane.

Najpierw utworzymy dwie tabele do przechowywania pomiarów dla każdej grupy 20 roślin:

 import numpy as np

group1 = np.array([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15, 16, 16, 13, 14, 12])
group2 = np.array([15, 17, 14, 17, 14, 8, 12, 19, 19, 14, 17, 22, 24, 16, 13, 16, 13, 18, 15, 13])

Krok 2: Wykonaj test t dla dwóch próbek.

Następnie użyjemy funkcji ttest_ind() z biblioteki scipy.stats, aby wykonać dwuprzykładowy test t, który wykorzystuje następującą składnię:

ttest_ind(a, b, równa_zmienna=True)

Złoto:

  • a: tabela przykładów obserwacji dla grupy 1
  • b: tabela przykładów obserwacji dla grupy 2
  • Równa_zmienna: Jeśli ma wartość true, wykonaj standardowy niezależny test t dla 2 próbek, który zakłada równe wariancje populacji. Jeśli jest fałszywy, wykonaj test t Welcha , który nie zakłada równych wariancji populacji. Domyślnie jest to prawdą.

Przed wykonaniem testu musimy zdecydować, czy przyjmiemy, że obie populacje mają równe wariancje. Ogólnie rzecz biorąc, możemy założyć, że populacje mają równe wariancje, jeśli stosunek wariancji największej próbki do wariancji najmniejszej próbki jest mniejszy niż 4:1.

 #find variance for each group
print(np.var(group1), np.var(group2))

7.73 12.26

Stosunek wariancji największej próby do wariancji najmniejszej próby wynosi 12,26/7,73 = 1,586 , czyli mniej niż 4. Oznacza to, że możemy założyć, że wariancje populacji są równe.

Zatem możemy przystąpić do wykonania testu t dla dwóch próbek z równymi wariancjami:

 import scipy.stats as stats

#perform two sample t-test with equal variances
stats.ttest_ind(a=group1, b=group2, equal_var=True)

(statistic=-0.6337, pvalue=0.53005)

Statystyka testu t wynosi -0,6337 , a odpowiadająca dwustronna wartość p wynosi 0,53005 .

Krok 3: Interpretacja wyników.

Dwa założenia tego konkretnego testu t dla dwóch próbek są następujące:

H 0 : µ 1 = µ 2 (średnie z obu populacji są równe)

H A : µ 1 ≠µ 2 (średnie z obu populacji nie są równe)

Ponieważ wartość p naszego testu (0,53005) jest większa niż alfa = 0,05, nie udało nam się odrzucić hipotezy zerowej testu. Nie mamy wystarczających dowodów, aby stwierdzić, że średnia wysokość roślin w obu populacjach jest różna.

Dodatkowe zasoby

Jak wykonać test T dla jednej próby w Pythonie
Jak wykonać test T dla sparowanych próbek w Pythonie

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *