Jak obliczyć przedziały ufności w sas-ie


Przedział ufności to zakres wartości, który prawdopodobnie będzie zawierał parametr populacji z pewnym poziomem ufności.

W tym samouczku wyjaśniono, jak obliczyć następujące przedziały ufności w R:

1. Przedział ufności dla średniej populacji

2. Przedział ufności dla różnicy średnich z populacji

Chodźmy!

Przykład 1: Przedział ufności dla średniej populacji w SAS

Załóżmy, że mamy następujący zestaw danych zawierający wysokość (w calach) losowej próbki 12 roślin należących do tego samego gatunku:

 /*create dataset*/
data my_data;
    inputHeight ;
    datalines ;
14
14
16
13
12
17
15
14
15
13
15
14
;
run ;

/*view dataset*/
proc print data =my_data; 

Załóżmy, że chcemy obliczyć 95% poziom ufności dla prawdziwej średniej wielkości populacji tego gatunku.

W tym celu możemy użyć następującego kodu w SAS-ie:

 /*generate 95% confidence interval for population mean*/
proc ttest data =my_data alpha = 0.05 ;
    varHeight ;
run ;

Wartość średniej wskazuje średnią próbki, a wartości mniejsze niż 95% CL Mean pokazują 95% przedział ufności dla średniej populacji.

Z wyników widzimy, że 95% przedział ufności dla średniej masy rośliny w tej populacji wynosi [13,4624 cala, 15,2042 cala] .

Przykład 2: Przedział ufności dla różnicy średnich populacji w SAS

Załóżmy, że mamy następujący zbiór danych zawierający wysokość (w calach) losowej próbki roślin należących do dwóch różnych gatunków:

 /*create dataset*/
data my_data2;
    input Species $Height;
    datalines ;
At 14
At 14
At 16
At 13
AT 12
At 17
At 15
At 14
At 15
At 13
B15
B14
B 19
B 19
B17
B 18
B20
B 19
B17
B15
;
run ;

/*view dataset*/
proc print data =my_data2; 

Załóżmy, że chcemy obliczyć 95% poziom ufności dla różnicy w średniej wielkości populacji między gatunkami A i gatunkami B.

W tym celu możemy użyć następującego kodu w SAS-ie:

 /*sort data by Species to ensure confidence interval is calculated correctly*/
proc sort data =my_data2;
    by Species;
run ;

/*generate 95% confidence interval for difference in population means*/
proc ttest data =my_data2 alpha = 0.05 ;
    class Species;
    varHeight ;
run ;

Pierwszą tabelą, na którą musimy zwrócić uwagę w wynikach, jest Równość wariancji , która sprawdza, czy wariancja między każdą próbą jest równa, czy nie.

Ponieważ wartość p w tej tabeli jest nie mniejsza niż 0,05, możemy założyć, że różnice między obiema grupami są równe.

Możemy więc spojrzeć na linię wykorzystującą łączną wariancję do znalezienia 95% przedziału ufności dla różnicy średnich z populacji.

Z wyniku widzimy, że 95% przedział ufności dla różnicy między średnimi z populacji wynosi [-4,6895 cala, -1,1305 cala] .

To mówi nam, że możemy być pewni w 95%, że prawdziwa różnica między średnią wysokością roślin gatunku A i gatunku B wynosi od -4,6895 cala do -1,1305 cala.

Ponieważ0 nie mieści się w tym przedziale ufności , oznacza to, że istnieje statystycznie istotna różnica między średnimi z obu populacji.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w SAS-ie:

Jak wykonać test t dla jednej próby w SAS
Jak wykonać test t dla dwóch próbek w SAS
Jak wykonać test t dla sparowanych próbek w SAS

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *