Como calcular intervalos de confiança no sas
Um intervalo de confiança é um intervalo de valores que provavelmente contém um parâmetro populacional com um certo nível de confiança.
Este tutorial explica como calcular os seguintes intervalos de confiança em R:
1. Intervalo de confiança para uma média populacional
2. Intervalo de confiança para diferença nas médias populacionais
Vamos!
Exemplo 1: Intervalo de confiança para a média populacional no SAS
Suponha que temos o seguinte conjunto de dados contendo a altura (em polegadas) de uma amostra aleatória de 12 plantas, todas pertencentes à mesma espécie:
/*create dataset*/ data my_data; inputHeight ; datalines ; 14 14 16 13 12 17 15 14 15 13 15 14 ; run ; /*view dataset*/ proc print data =my_data;
Suponha que queiramos calcular um nível de confiança de 95% para o verdadeiro tamanho médio da população desta espécie.
Podemos usar o seguinte código no SAS para fazer isso:
/*generate 95% confidence interval for population mean*/ proc ttest data =my_data alpha = 0.05 ; varHeight ; run ;
O valor da Média indica a média amostral, e valores inferiores a 95% CL Mean mostram o intervalo de confiança de 95% para a média populacional.
A partir dos resultados, podemos ver que o intervalo de confiança de 95% para o peso médio da planta desta população é [13,4624 polegadas, 15,2042 polegadas] .
Exemplo 2: Intervalo de confiança para a diferença nas médias populacionais no SAS
Suponha que temos o seguinte conjunto de dados contendo a altura (em polegadas) de uma amostra aleatória de plantas pertencentes a duas espécies diferentes:
/*create dataset*/
data my_data2;
input Species $Height;
datalines ;
At 14
At 14
At 16
At 13
AT 12
At 17
At 15
At 14
At 15
At 13
B15
B14
B 19
B 19
B17
B 18
B20
B 19
B17
B15
;
run ;
/*view dataset*/
proc print data =my_data2;
Suponha que queiramos calcular um nível de confiança de 95% para a diferença no tamanho médio da população entre as espécies A e as espécies B.
Podemos usar o seguinte código no SAS para fazer isso:
/*sort data by Species to ensure confidence interval is calculated correctly*/
proc sort data =my_data2;
by Species;
run ;
/*generate 95% confidence interval for difference in population means*/
proc ttest data =my_data2 alpha = 0.05 ;
class Species;
varHeight ;
run ;
A primeira tabela que precisamos observar no resultado é a Igualdade de Variâncias , que testa se a variância entre cada amostra é igual ou não.
Como o valor p não é inferior a 0,05 nesta tabela, podemos assumir que as diferenças entre os dois grupos são iguais.
Portanto, podemos olhar para a reta que utiliza a variância agrupada para encontrar o intervalo de confiança de 95% para a diferença nas médias populacionais.
A partir do resultado, podemos ver que o intervalo de confiança de 95% para a diferença entre as médias da população é [-4,6895 polegadas, -1,1305 polegadas] .
Isso nos diz que podemos ter 95% de certeza de que a verdadeira diferença entre a altura média das plantas das espécies A e da espécie B está entre -4,6895 polegadas e -1,1305 polegadas.
Como 0 não está neste intervalo de confiança , isso indica que existe uma diferença estatisticamente significativa entre as médias das duas populações.
Recursos adicionais
Os tutoriais a seguir explicam como executar outras tarefas comuns no SAS:
Como realizar um teste t de uma amostra no SAS
Como realizar um teste t de duas amostras no SAS
Como realizar um teste t de amostras pareadas no SAS