Przedział ufności dla współczynnika korelacji
Przedział ufności dla współczynnika korelacji to zakres wartości, który może zawierać współczynnik korelacji populacji przy pewnym poziomie ufności.
W tym samouczku wyjaśniono następujące kwestie:
- Motywacja tworzenia tego typu przedziału ufności.
- Wzór na utworzenie tego typu przedziału ufności.
- Przykład tworzenia tego typu przedziału ufności.
- Jak interpretować tego typu przedział ufności.
Przedział ufności dla współczynnika korelacji: motywacja
Powodem utworzenia przedziału ufności dla współczynnika korelacji jest uchwycenie naszej niepewności podczas szacowania współczynnika korelacji populacji.
Załóżmy na przykład, że chcemy oszacować współczynnik korelacji między wzrostem i wagą mieszkańców określonego powiatu. Ponieważ hrabstwo liczy tysiące mieszkańców, zbieranie informacji na temat wzrostu i masy ciała każdego mieszkańca byłoby zbyt kosztowne i czasochłonne.
Zamiast tego moglibyśmy wybrać prostą losową próbę mieszkańców i po prostu zebrać o nich informacje.
Ponieważ wybieramy losową próbę mieszkańców, nie ma gwarancji, że współczynnik korelacji między wzrostem i masą tych mieszkańców będzie dokładnie odpowiadał współczynnikowi korelacji większej populacji.
Aby więc uchwycić tę niepewność, możemy utworzyć przedział ufności zawierający zakres wartości, które prawdopodobnie będą zawierać prawdziwy współczynnik korelacji między wzrostem i wagą mieszkańców tego powiatu.
Przedział ufności dla współczynnika korelacji: wzór
Poniższe kroki służą do obliczenia przedziału ufności dla współczynnika korelacji populacji w oparciu o wielkość próby n i współczynnik korelacji r próby.
Krok 1: Wykonaj transformację Fishera.
Niech z r = ln((1+r) / (1-r)) / 2
Krok 2: Znajdź górną i dolną granicę dziennika.
Niech L = z r – (z 1-α/2 /√ n-3 )
Niech U = z r + (z 1-α/2 /√ n-3 )
Krok 3: Znajdź przedział ufności.
Ostateczny przedział ufności można znaleźć, korzystając z następującego wzoru:
Przedział ufności = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]
Przedział ufności dla współczynnika korelacji: przykład
Załóżmy, że chcemy oszacować współczynnik korelacji pomiędzy wzrostem i masą ciała mieszkańców danego powiatu. Wybieramy losową próbę 30 mieszkańców i znajdujemy następujące informacje:
- Wielkość próby n = 30
- Współczynnik korelacji wzrostu i masy ciała r = 0,56
Oto jak znaleźć 95% przedział ufności dla współczynnika korelacji populacji:
Krok 1: Wykonaj transformację Fishera.
Niech z r = ln((1+r) / (1-r)) / 2 = ln((1+.56) / (1-.56)) / 2 = 0.6328
Krok 2: Znajdź górną i dolną granicę dziennika.
Niech L = z r – (z 1-α/2 /√ n-3 ) = 0,6328 – (1,96 /√ 30-3 ) = 0,2556
Niech U = z r + (z 1-α/2 /√ n-3 ) = 0,6328 + (1,96 /√ 30-3 ) = 1,01
Krok 3: Znajdź przedział ufności.
Przedział ufności = [(e 2L -1)/(e 2L +1), (e 2U -1)/(e 2U +1)]
Przedział ufności = [(e 2(.2556) -1)/(e 2(.2556) +1), (e 2(1.01) -1)/(e 2(1.01) +1)] = [. 2502, .7658]
Uwaga: ten przedział ufności można również znaleźć, korzystając z przedziału ufności dla kalkulatora współczynnika korelacji .
Przedział ufności dla współczynnika korelacji: interpretacja
Sposób, w jaki interpretujemy przedział ufności, wygląda następująco:
Istnieje 95% szans, że przedział ufności [0,2502, 0,7658] zawiera prawdziwy współczynnik korelacji populacyjnej pomiędzy wzrostem i masą ciała mieszkańców tego powiatu.
Innym sposobem powiedzenia tego samego jest stwierdzenie, że istnieje tylko 5% szans, że prawdziwy współczynnik korelacji populacji leży poza 95% przedziałem ufności.
Oznacza to, że istnieje tylko 5% szans, że rzeczywisty współczynnik korelacji populacji pomiędzy wzrostem i masą ciała mieszkańców tego powiatu jest mniejszy niż 0,2502 lub większy niż 0,7658.