Próbkowanie rozkładu różnicy proporcji

W artykule wyjaśniono, na czym polega różnica w proporcjonalnym rozkładzie próbkowania i do czego służy w statystyce. Zaprezentowano także wzór na różnicę w proporcjach rozkładu próbkowania oraz krok po kroku rozwiązane ćwiczenie.

Jaki jest rozkład próbkowania różnicy proporcji?

Różnica w proporcjach rozkładu próbkowania to rozkład wynikający z obliczenia różnic pomiędzy proporcjami próbkowania wszystkich możliwych próbek z dwóch różnych populacji.

Oznacza to, że proces uzyskiwania rozkładu próbkowania różnicy proporcji polega, po pierwsze, na wyodrębnieniu wszystkich możliwych próbek z dwóch różnych populacji, po drugie, na określeniu proporcji każdej wyodrębnionej próbki, i wreszcie na określeniu różnicy pomiędzy wszystkimi proporcje różnicy proporcji. dwie populacje. Tak, że zbiór wyników uzyskanych po wykonaniu tych operacji tworzy rozkład próbkowania różnicy proporcji.

rozkład próbkowania różnicy proporcji

W statystyce różnica w proporcjach rozkładu próbkowania służy do obliczenia prawdopodobieństwa, że różnica między proporcjami dwóch losowo wybranych próbek będzie bliska różnicy w proporcjach populacji.

Wzór na rozkład różnicy proporcji w próbce

Próbki wybrane ze względu na różnicę proporcji rozkładu próbkowania są definiowane przez rozkłady dwumianowe , ponieważ dla celów praktycznych proporcja jest stosunkiem przypadków pomyślnych do całkowitej liczby obserwacji.

Niemniej jednak, dzięki centralnemu twierdzeniu granicznemu, rozkłady dwumianowe można przybliżyć do normalnych rozkładów prawdopodobieństwa . Dlatego rozkład próbkowania różnicy proporcji można przybliżyć do rozkładu normalnego o następujących cechach:

\begin{array}{c}\displaystyle\mu_{\widehat{p_1}-\widehat{p_2}}=p_1-p_2 \qquad \sigma_{\widehat{p_1}-\widehat{p_2}}=\sqrt{\frac{p_1q_1}{n_1}+\frac{p_2q_2}{n_2}}\\[6ex]\displaystyle N_{p}\left(p_1-p_2, \sqrt{\frac{p_1q_1}{n_1}+\frac{p_2q_2}{n_2}}\right) \end{array}

Uwaga: Rozkład próbkowania różnicy proporcji można przybliżyć do rozkładu normalnego tylko wtedy, gdy:

n_1\geq30

,

n_2\geq 30

,

n_1p_1\geq5

,

n_2p_2\geq5

,

n_1q_1\geq5

I

n_2q_2\geq5

.

Ponieważ zatem rozkład próbkowania różnicy proporcji można przybliżyć do rozkładu normalnego, wzór na obliczenie statystyki rozkładu próbkowania różnicy proporcji jest następujący:

Z=\cfrac{(\widehat{p_1}-\widehat{p_2})-(p_1-p_2)}{\displaystyle\sqrt{\frac{p_1q_1}{n_1}+\frac{p_2q_2}{n_2}}}

Złoto:

  • \widehat{p_i}

    jest proporcją próbki, tj.

  • p_i

    to odsetek populacji, tj.

  • q_i

    jest prawdopodobieństwem niepowodzenia populacji i,

    q_i=1-p_i

    .

  • n_i

    to wielkość próbki, tj.

  • Z

    jest zmienną zdefiniowaną przez standardowy rozkład normalny N(0,1).

Wzór ten jest podobny do wzoru na testowanie hipotezy na różnicę proporcji.

Konkretny przykład rozkładu próbkowania różnicy proporcji

Po zapoznaniu się z definicją różnicy proporcji rozkładu próbkowania i jej wzorem, możesz zobaczyć poniżej rozwiązany przykład krok po kroku, aby zakończyć zrozumienie koncepcji.

  • Chcesz przeanalizować dokładność dwóch zakładów produkcyjnych, jedna fabryka produkuje w taki sposób, że tylko 5% wyprodukowanych części ma wady, podczas gdy w innej fabryce odsetek wadliwych części wynosi 8%. Jeśli weźmiemy próbkę 200 części z pierwszej fabryki i kolejną próbkę 280 części z drugiej fabryki, jakie jest prawdopodobieństwo, że procent defektów w pierwszym zakładzie produkcyjnym będzie większy niż procent defektów w drugiej fabryce? produkcja?

Aby zakończyć poznanie wszystkich danych problemu, najpierw obliczymy proporcję dobrze wyprodukowanych części każdej rośliny:

\begin{array}{c}q_1=1-p_1=1-0,05=0,95\\[2ex]q_2=1-p_2=1-0,08=0,92\end{array}

Jeżeli wskaźnik defektów w pierwszej fabryce był większy niż współczynnik defektów w drugiej fabryce, oznacza to, że prawdziwe byłoby następujące równanie:

\widehat{p_1}-\widehat{p_2}>0″ title=”Rendered by QuickLaTeX.com” height=”18″ width=”89″ style=”vertical-align: -4px;”></p>
</p>
<p> Aby więc określić prawdopodobieństwo rozkładu próbkowania różnicy proporcji, musimy zastosować wzór wyjaśniony w powyższej sekcji:</p>
</p>
<p class=Z=\cfrac{(\widehat{p_1}-\widehat{p_2})-(p_1-p_2)}{\displaystyle\sqrt{\frac{p_1q_1}{n_1}+\frac{p_2q_2}{n_2}}}=\cfrac{0-(0,05-0,08)}{\displaystyle\sqrt{\frac{0,05\cdot 0,95}{200}+\frac{0,08\cdot 0,92}{280}}}=1,34

Zatem prawdopodobieństwo, że współczynnik defektów w pierwszej fabryce jest większy niż współczynnik defektów w drugiej fabryce, jest równoważne prawdopodobieństwu, że zmienna Z jest większa niż 1,34:

P[(\widehat{p_1}-\widehat{p_2})>0]=P[Z>1,34]” title=”Rendered by QuickLaTeX.com” height=”19″ width=”242″ style=”vertical-align: -5px;”></p>
</p>
<p> Na koniec wystarczy poszukać odpowiedniego prawdopodobieństwa w <a href=tabeli rozkładu normalnego i już rozwiązaliśmy problem:

P[(\widehat{p_1}-\widehat{p_2})>0]=P[Z>1,34]=0,0901″ title=”Rendered by QuickLaTeX.com” height=”19″ width=”319″ style=”vertical-align: -5px;”></p>
</p>
<p> Krótko mówiąc, prawdopodobieństwo, że odsetek wad w pierwszej fabryce będzie większy niż odsetek wad w drugiej fabryce, wynosi 9,01%. </p>
<div style= Zobacz: Próbkowanie rozkładu różnicy średnich

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *