So führen sie einen f-test in python durch


Ein F-Test wird verwendet, um zu testen, ob zwei Populationsvarianzen gleich sind. Die Null- und Alternativhypothese des Tests lauten wie folgt:

H 0 : σ 1 2 = σ 2 2 (Populationsvarianzen sind gleich)

H 1 : σ 1 2 ≠ σ 2 2 (Populationsvarianzen sind nicht gleich)

In diesem Tutorial wird erläutert, wie Sie einen F-Test in Python durchführen.

Beispiel: F-Test in Python

Angenommen, wir haben die folgenden zwei Beispiele:

 x = [18, 19, 22, 25, 27, 28, 41, 45, 51, 55]
y = [14, 15, 15, 17, 18, 22, 25, 25, 27, 34]

Mit der folgenden Funktion können wir einen F-Test durchführen, um zu bestimmen, ob die beiden Populationen, aus denen diese Stichproben stammen, gleiche Varianzen aufweisen:

 import numpy as np

#define F-test function
def f_test(x, y):
    x = np.array(x)
    y = np.array(y)
    f = np.var(x, ddof=1)/np.var(y, ddof=1) #calculate F test statistic
    dfn = x.size-1 #define degrees of freedom numerator
    dfd = y.size-1 #define degrees of freedom denominator
    p = 1-scipy.stats.f.cdf(f, dfn, dfd) #find p-value of F test statistic
    return f,p

#perform F-test
f_test(x, y)

(4.38712, 0.019127)

Die F-Test-Statistik beträgt 4,38712 und der entsprechende p-Wert beträgt 0,019127 . Da dieser p-Wert kleiner als 0,05 ist, würden wir die Nullhypothese ablehnen. Dies bedeutet, dass wir genügend Beweise haben, um zu sagen, dass die beiden Populationsvarianzen nicht gleich sind.

Kommentare

  • Die F-Teststatistik wird als s 1 2 / s 2 2 berechnet. Standardmäßig berechnet numpy.var die Populationsvarianz. Um die Stichprobenvarianz zu berechnen, müssen wir ddof=1 angeben.
  • Der p-Wert entspricht 1 – cdf der Verteilung F mit Freiheitsgraden im Zähler = n 1 -1 und Freiheitsgraden im Nenner = n 2 -1.
  • Diese Funktion funktioniert nur, wenn die Varianz der ersten Stichprobe größer ist als die Varianz der zweiten Stichprobe. Stellen Sie also beide Beispiele so ein, dass sie mit der Funktion funktionieren.

Wann ist der F-Test anzuwenden?

Der F-Test wird typischerweise zur Beantwortung einer der folgenden Fragen verwendet:

1. Stammen zwei Stichproben aus Populationen mit gleichen Varianzen?

2. Reduziert eine neue Behandlung oder ein neuer Prozess die Variabilität einer aktuellen Behandlung oder eines aktuellen Prozesses?

Verwandte Themen: So führen Sie einen F-Test in R durch

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert