Como calcular intervalos de confiança no sas


Um intervalo de confiança é um intervalo de valores que provavelmente contém um parâmetro populacional com um certo nível de confiança.

Este tutorial explica como calcular os seguintes intervalos de confiança em R:

1. Intervalo de confiança para uma média populacional

2. Intervalo de confiança para diferença nas médias populacionais

Vamos!

Exemplo 1: Intervalo de confiança para a média populacional no SAS

Suponha que temos o seguinte conjunto de dados contendo a altura (em polegadas) de uma amostra aleatória de 12 plantas, todas pertencentes à mesma espécie:

 /*create dataset*/
data my_data;
    inputHeight ;
    datalines ;
14
14
16
13
12
17
15
14
15
13
15
14
;
run ;

/*view dataset*/
proc print data =my_data; 

Suponha que queiramos calcular um nível de confiança de 95% para o verdadeiro tamanho médio da população desta espécie.

Podemos usar o seguinte código no SAS para fazer isso:

 /*generate 95% confidence interval for population mean*/
proc ttest data =my_data alpha = 0.05 ;
    varHeight ;
run ;

O valor da Média indica a média amostral, e valores inferiores a 95% CL Mean mostram o intervalo de confiança de 95% para a média populacional.

A partir dos resultados, podemos ver que o intervalo de confiança de 95% para o peso médio da planta desta população é [13,4624 polegadas, 15,2042 polegadas] .

Exemplo 2: Intervalo de confiança para a diferença nas médias populacionais no SAS

Suponha que temos o seguinte conjunto de dados contendo a altura (em polegadas) de uma amostra aleatória de plantas pertencentes a duas espécies diferentes:

 /*create dataset*/
data my_data2;
    input Species $Height;
    datalines ;
At 14
At 14
At 16
At 13
AT 12
At 17
At 15
At 14
At 15
At 13
B15
B14
B 19
B 19
B17
B 18
B20
B 19
B17
B15
;
run ;

/*view dataset*/
proc print data =my_data2; 

Suponha que queiramos calcular um nível de confiança de 95% para a diferença no tamanho médio da população entre as espécies A e as espécies B.

Podemos usar o seguinte código no SAS para fazer isso:

 /*sort data by Species to ensure confidence interval is calculated correctly*/
proc sort data =my_data2;
    by Species;
run ;

/*generate 95% confidence interval for difference in population means*/
proc ttest data =my_data2 alpha = 0.05 ;
    class Species;
    varHeight ;
run ;

A primeira tabela que precisamos observar no resultado é a Igualdade de Variâncias , que testa se a variância entre cada amostra é igual ou não.

Como o valor p não é inferior a 0,05 nesta tabela, podemos assumir que as diferenças entre os dois grupos são iguais.

Portanto, podemos olhar para a reta que utiliza a variância agrupada para encontrar o intervalo de confiança de 95% para a diferença nas médias populacionais.

A partir do resultado, podemos ver que o intervalo de confiança de 95% para a diferença entre as médias da população é [-4,6895 polegadas, -1,1305 polegadas] .

Isso nos diz que podemos ter 95% de certeza de que a verdadeira diferença entre a altura média das plantas das espécies A e da espécie B está entre -4,6895 polegadas e -1,1305 polegadas.

Como 0 não está neste intervalo de confiança , isso indica que existe uma diferença estatisticamente significativa entre as médias das duas populações.

Recursos adicionais

Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:

Como realizar um teste t de uma amostra no SAS
Como realizar um teste t de duas amostras no SAS
Como realizar um teste t de amostras pareadas no SAS

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *