인구 대 샘플: 차이점이 무엇인가요?
통계에서 우리는 특정 연구 질문에 답하기 위해 데이터를 수집하려는 경우가 많습니다.
예를 들어, 다음 질문에 답하고 싶을 수 있습니다.
1. 플로리다주 마이애미의 평균 가계 소득은 얼마입니까?
2. 특정 거북이 개체군의 평균 체중은 얼마입니까?
3. 특정 카운티의 주민 중 몇 퍼센트가 특정 법률을 지지합니까?
각 시나리오에서 우리는 측정하려는 가능한 모든 개별 요소를 나타내는 모집단 에 대한 질문에 답하고 싶습니다.
그러나 모집단의 모든 개인에 대한 데이터를 수집하는 대신 인구의 일부를 나타내는 모집단 표본 에 대한 데이터를 수집합니다.
인구 : 측정하려는 가능한 모든 개별 항목입니다.
표본: 인구의 일부.
다음은 세 가지 소개 예에서 모집단과 표본의 예입니다.
예 1: 플로리다 주 마이애미의 평균 가계 소득은 얼마입니까?
전체 인구는 50만 가구로 구성될 수 있지만, 총 2,000가구의 표본 에 대해서만 데이터를 수집할 수 있습니다.
2. 특정 거북이 개체군의 평균 체중은 얼마입니까?
전체 개체수에는 800마리의 거북이가 포함될 수 있지만, 우리는 30마리의 거북이 샘플 에 대해서만 데이터를 수집할 수 있습니다.
3. 특정 카운티의 주민 중 몇 퍼센트가 특정 법률을 지지합니까?
총 인구는 50,000명일 수 있지만, 우리는 1,000명의 표본 에 대해서만 데이터를 수집할 수 있습니다.
샘플을 사용하는 이유는 무엇입니까?
일반적으로 전체 모집단이 아닌 표본에 대한 데이터를 수집하는 데에는 다음과 같은 몇 가지 이유가 있습니다.
1 . 전체 인구에 대한 데이터를 수집하는 데 너무 오랜 시간이 걸립니다 . 예를 들어, 플로리다 주 마이애미의 중간 가계 소득을 알고 싶다면 각 가구의 소득을 수집하는 데 몇 달 또는 몇 년이 걸릴 수 있습니다. 우리가 이 모든 데이터를 수집할 때쯤에는 모집단이 변경되었거나 우리가 관심 있는 연구 질문이 더 이상 존재하지 않을 수도 있습니다.
2. 전체 인구에 대한 데이터를 수집하는 데 비용이 너무 많이 듭니다. 모집단의 각 개인에 대한 데이터를 수집하는 것은 종종 비용이 너무 많이 들기 때문에 대신 표본에 대한 데이터를 수집하기로 결정했습니다.
3. 전체 인구에 대한 데이터를 수집하는 것은 불가능합니다. 많은 경우 모집단의 모든 개인에 대한 데이터를 수집하는 것은 불가능합니다. 예를 들어 특정 관심 개체군에서 모든 거북이를 찾아 무게를 측정하는 것은 매우 어려울 수 있습니다.
표본에 대한 데이터를 수집함으로써 특정 모집단에 대한 정보를 훨씬 더 빠르고 저렴한 비용으로 수집할 수 있습니다.
그리고 표본이 모집단을 대표 하는 경우 높은 신뢰도를 갖고 한 표본의 결과를 더 큰 모집단에 일반화할 수 있습니다.
대표 샘플의 중요성
모집단에서 표본을 수집할 때 이상적으로는 표본이 모집단의 “소형 버전”과 유사하기를 원합니다.
예를 들어, 총 5,000명의 학생이 있는 특정 학군에 있는 학생들의 영화 선호도를 이해하고 싶다고 가정해 보겠습니다. 각 학생을 개별적으로 조사하는 것은 너무 오랜 시간이 걸리기 때문에 대신 100명의 학생을 표본으로 추출하여 선호도에 대해 물어볼 수 있었습니다.
전체 학생 인구가 여학생 50%, 남학생 50%인 경우, 남학생 90%, 여학생 10%만 포함한다면 표본이 대표적이지 않을 것입니다.
또는 전체 모집단이 신입생, 2학년, 3학년, 4학년의 비율로 동일하다면 신입생만 포함한다면 표본이 대표적이지 않을 것입니다.
표본에 포함된 개인의 특성이 전체 모집단에 포함된 개인의 특성과 밀접하게 일치하는 경우 표본은 모집단을 대표합니다.
이런 일이 발생하면 표본의 결과를 전체 모집단에 자신있게 일반화할 수 있습니다.
샘플을 얻는 방법
표본 모집단을 얻기 위해 사용할 수 있는 다양한 방법이 있습니다.
대표 표본을 얻을 가능성을 최대화하기 위해 다음 세 가지 방법 중 하나를 사용할 수 있습니다.
단순 무작위 샘플링: 난수 생성기 또는 무작위 선택 수단을 사용하여 무작위로 개인을 선택합니다.
체계적 무작위 샘플링: 모집단의 각 구성원을 특정 순서로 배치합니다. 임의의 시작점을 선택하고 n개 중 하나를 표본의 일부로 선택합니다.
계층화된 무작위 샘플링: 모집단을 그룹으로 나눕니다. 각 그룹에서 표본에 포함될 몇 명의 구성원을 무작위로 선택합니다.
이러한 각 방법에서 모집단의 각 개인은 표본에 포함될 확률이 동일합니다. 이는 모집단의 “소형 버전”인 표본을 얻을 가능성을 최대화합니다.