Sas에서 신뢰 구간을 계산하는 방법
신뢰구간은 일정 수준의 신뢰도를 갖는 모집단 매개변수가 포함될 가능성이 있는 값의 범위입니다.
이 튜토리얼에서는 R에서 다음 신뢰 구간을 계산하는 방법을 설명합니다.
1. 모집단 평균에 대한 신뢰 구간
2. 모집단 평균의 차이에 대한 신뢰구간
갑시다!
예 1: SAS의 모집단 평균에 대한 신뢰 구간
모두 같은 종에 속하는 12개 식물의 무작위 표본의 높이(인치)를 포함하는 다음 데이터 세트가 있다고 가정합니다.
/*create dataset*/ data my_data; inputHeight ; datalines ; 14 14 16 13 12 17 15 14 15 13 15 14 ; run ; /*view dataset*/ proc print data =my_data;
이 종의 실제 평균 개체군 크기에 대한 95% 신뢰 수준을 계산한다고 가정합니다.
이를 위해 SAS에서 다음 코드를 사용할 수 있습니다.
/*generate 95% confidence interval for population mean*/ proc ttest data =my_data alpha = 0.05 ; varHeight ; run ;
Mean 의 값은 표본 평균을 나타내고, 95% CL Mean 보다 작은 값은 모집단 평균에 대한 95% 신뢰구간을 나타냅니다.
결과에서 이 모집단의 평균 식물 무게에 대한 95% 신뢰 구간이 [13.4624인치, 15.2042인치] 임을 알 수 있습니다.
예 2: SAS의 모집단 평균 차이에 대한 신뢰 구간
서로 다른 두 종에 속하는 식물의 무작위 표본의 높이(인치)를 포함하는 다음 데이터 세트가 있다고 가정합니다.
/*create dataset*/
data my_data2;
input Species $Height;
datalines ;
At 14
At 14
At 16
At 13
AT 12
At 17
At 15
At 14
At 15
At 13
B15
B14
B 19
B 19
B17
B 18
B20
B 19
B17
B15
;
run ;
/*view dataset*/
proc print data =my_data2;
종 A와 종 B 사이의 평균 개체군 크기 차이에 대한 95% 신뢰 수준을 계산한다고 가정합니다.
이를 위해 SAS에서 다음 코드를 사용할 수 있습니다.
/*sort data by Species to ensure confidence interval is calculated correctly*/
proc sort data =my_data2;
by Species;
run ;
/*generate 95% confidence interval for difference in population means*/
proc ttest data =my_data2 alpha = 0.05 ;
class Species;
varHeight ;
run ;
결과에서 살펴봐야 할 첫 번째 테이블은 각 표본 간의 분산이 같은지 여부를 테스트하는 Equality of Variances 입니다.
이 표에서 p-값은 0.05 이상이므로 두 그룹 간의 차이가 동일하다고 가정할 수 있습니다.
따라서 합동 분산을 사용하여 모집단 평균의 차이에 대한 95% 신뢰 구간을 찾는 선을 살펴볼 수 있습니다.
결과에서 모집단 평균 간의 차이에 대한 95% 신뢰구간이 [-4.6895인치, -1.1305인치] 임을 알 수 있습니다.
이는 A종과 B종의 평균 식물 높이 사이의 실제 차이가 -4.6895인치에서 -1.1305인치 사이에 있다는 것을 95% 확신할 수 있음을 말해줍니다.
이 신뢰 구간에는 0이 없으므로 이는 두 모집단의 평균 간에 통계적으로 유의미한 차이가 있음을 나타냅니다.
추가 리소스
다음 튜토리얼에서는 SAS에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
SAS에서 단일 표본 t-검정을 수행하는 방법
SAS에서 2-표본 t-검정을 수행하는 방법
SAS에서 쌍체 표본 t-검정을 수행하는 방법