체계적인 샘플링

이번 글에서는 체계적 샘플링이 무엇인지, 그 특징과 수행 방법에 대해 설명합니다. 체계적인 샘플링의 예도 볼 수 있습니다. 또한 체계적인 샘플링의 장점과 단점이 무엇인지, 이러한 유형의 샘플링을 사용해야 하는 경우에 대해 알아봅니다.

체계적 샘플링이란 무엇입니까?

체계적 표본추출은 통계 연구를 위한 표본의 일부가 될 요소를 선택하는 데 사용되는 확률 방법입니다. 체계적 표본추출에서는 먼저 하나의 요소가 무작위로 선택되고 표본의 다른 요소는 고정된 간격으로 선택됩니다.

체계적인 샘플링

따라서 체계적 표본추출에서는 표본에서 첫 번째 개체를 무작위로 선택한 후 표본에서 다음 개체를 추출하기 위해 원하는 간격만큼 많은 숫자를 계산해야 합니다. 그리고 우리가 얻고자 하는 표본 크기만큼 표본에 개인이 포함될 때까지 동일한 절차를 연속적으로 반복합니다.

반면에, 표본에서 개인을 선택하는 더 많은 방법이 있다는 것을 알아야 합니다. 가장 많이 사용되는 샘플링 유형은 다음과 같습니다.

  • 단순 무작위 샘플링
  • 계층화된 샘플링
  • 체계적인 샘플링
  • 클러스터 샘플링

probabilistica.com에는 각 유형의 확률 샘플링에 대한 자세한 설명이 있으므로 더 관심이 있으시면 웹사이트에서 각 유형이 어떻게 수행되는지 검색하실 수 있습니다.

체계적인 샘플링을 수행하는 방법

체계적인 무작위 샘플링을 수행하는 단계는 다음과 같습니다.

  1. 대상 모집단을 정의합니다.
  2. 원하는 샘플 크기를 결정합니다.
  3. 샘플링 간격을 계산합니다. 이를 위해 모집단 크기를 표본 크기로 나눕니다.
  4. 샘플의 첫 번째 항목을 무작위로 선택합니다.
  5. 샘플의 나머지 요소를 선택합니다. 이를 위해 샘플링 간격은 이전 단계에서 선택한 숫자에 연속적으로 추가됩니다 .

체계적 표본추출에서 첫 번째 항목을 무작위로 선택하는 것이 중요합니다. 왜냐하면 이 항목이 실제로 표본에서 무작위로 선택되는 유일한 항목이기 때문입니다. 그렇지 않으면 체계적인 샘플링의 무작위성이 손상될 수 있습니다. 이것이 바로 연구자가 모집단의 모든 요소가 출발점으로 선택될 확률이 동일하도록 보장해야 하는 이유입니다.

마찬가지로, 체계적 표본추출의 표본 요소들은 간격을 두고 선택되기 때문에 최종 표본에는 특정 유형의 요소가 없을 수 있으며, 이로 인해 표본의 대표성이 충분하지 않을 수 있습니다. 하지만 이는 체계적인 샘플링을 수행할 때 겪게 되는 위험입니다.

마지막으로, 샘플링 간격이 모델이 아니라는 점을 고려해야 합니다. 그렇게 하면 선택한 샘플이 적절하지 않고 통계 연구에서 신뢰할 수 없는 결과가 제공되기 때문입니다.

체계적인 샘플링의 예

체계적인 샘플링의 정의를 살펴본 후, 이러한 유형의 샘플링의 예를 설명하여 그 의미를 더 잘 이해할 수 있도록 하겠습니다.

예를 들어, 1000개 요소 모집단에 대해 체계적인 샘플링을 수행하여 50개 요소 샘플을 얻으려면 다음과 같이 진행해야 합니다.

먼저 샘플링 간격을 계산해야 합니다. 이를 위해 모집단 크기를 표본 크기로 나누면 됩니다.

k=\cfrac{1000}{50}=20

둘째, 표본의 첫 번째 대상을 무작위로 선택해야 합니다. 이 단계를 수행하려면 여러 가지 방법이 있지만 예를 들어 컴퓨터 프로그램 Excel을 사용하여 1에서 20까지의 난수를 얻을 수 있습니다(첫 번째 숫자는 첫 번째 조각에 있는 것이 좋습니다). 숫자 17을 얻었다고 가정해 보겠습니다.

\text{primer elemento de la poblaci\'on} = 17

다음으로, 샘플에서 다음 요소를 선택하려면 샘플링 간격(20)을 숫자 17에 추가해야 합니다. 원하는 샘플 크기가 50이므로 49개의 숫자를 더 선택해야 합니다.

\text{muestra}= 17, 37, 57, 77, 97, 117,\ldots ,997

따라서 나오는 수치와 동일시되는 모집단 요소는 통계 연구 표본의 일부로 선택된 요소입니다.

체계적 표본추출의 장점과 단점

체계적 샘플링에는 다음과 같은 장점과 단점이 있습니다.

이점 단점
체계적인 샘플링은 매우 빠르게 수행됩니다. 패턴이 있고 샘플링 간격과 일치하면 편향된 샘플을 얻게 됩니다.
이해하기 쉽습니다. 선택된 표본에는 무작위로 선택된 요소가 하나만 있습니다.
얻은 샘플은 일반적으로 대표적입니다. 초기 주제가 선택되면 일부 항목은 선택될 확률이 0이 됩니다.
체계적인 샘플링은 모집단의 일부에만 국한되지 않고 오히려 모집단 전체에 분포된 요소를 샘플링합니다. 변동 추정은 단순 무작위 표본 추출 시스템보다 더 복잡합니다.

위의 예에서 보았듯이 체계적인 샘플링은 빠르고 쉽게 수행할 수 있습니다. 비록 그렇게 보이지 않을 수도 있지만, 이 속성은 경제적 비용이 더 저렴하기 때문에 중요합니다.

체계적 표본추출의 또 다른 긍정적인 측면은 전체 모집단에서 표본을 추출한다는 점입니다. 반면에 다른 유형의 샘플링에서는 예를 들어 모집단의 전반부에서만 요소를 가져올 수 있습니다.

체계적 표본추출의 단점은 모집단 요소의 배치 순서가 통계 결과의 신뢰성을 좌우할 수 있다는 점입니다. 특정 유형의 주기성이나 패턴이 있는 경우 편향된 표본이 얻어질 수 있기 때문입니다. 예를 들어, 남성과 여성의 모집단을 다음과 같이 주문하면:

\text{M}\quad \text{H}\quad  \text{M}\quad \text{H}\quad  \text{M}\quad \text{H}\quad  \text{M}\quad \text{H}\quad  \text{M}\quad \text{H}\quad  \text{M} \quad \text{H}

이 순서로 샘플링 간격을 2로 하면 원산지에 따라 여성만 선택하거나 남성만 선택하게 됩니다. 따라서 신뢰할 수 없는 샘플을 얻게 됩니다.

마지막으로 체계적 샘플링의 또 다른 부정적인 측면은 하나의 요소만 무작위로 선택되어 샘플의 나머지 요소를 조정한다는 것입니다. 절차 전반에 걸쳐 기회가 훨씬 더 많이 존재하는 다른 유형의 샘플링과 달리.

체계적인 샘플링을 사용해야 하는 경우

마지막으로, 이 샘플링 시스템을 항상 사용할 수는 없기 때문에 체계적인 샘플링을 사용하는 것이 실용적인 경우와 그렇지 않은 경우를 보여줍니다.

체계적 샘플링은 간단하고 빠른 샘플링 방법 구현이 필요할 때 사용할 수 있습니다. 즉, 프로젝트 예산이 제한되어 있는 경우 체계적인 샘플링은 이를 수행하는 데 리소스가 거의 필요하지 않기 때문에 매우 좋은 선택입니다.

기사 전체에서 살펴본 것처럼 모집단이 특정 유형의 패턴을 보일 때 편향된 표본을 얻을 수 있으므로 이러한 유형의 샘플링을 사용하는 것은 실용적이지 않습니다.

마지막으로, 모집단 내에 서로 다른 집단이 여러 개 있는 경우, 즉 계층이 많은 경우에는 계층별 통계분석이 가능하기 때문에 체계적 표본추출이 불가능한 계층화 표본추출을 사용하는 것이 바람직하다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다