Excel에서 부트스트래핑하는 방법(예제 포함)


부트스트래핑은 표본 크기가 작고 기본 분포를 알 수 없는 경우 통계 에 대한 신뢰 구간을 구성하는 데 사용할 수 있는 방법입니다.

부트스트래핑의 기본 프로세스는 다음과 같습니다.

  • 주어진 데이터 세트에서 k개의 반복 샘플을 복원하여 추출합니다.
  • 각 샘플에 대해 관심 있는 통계를 계산합니다.
  • 이는 주어진 통계에 대해 k개의 서로 다른 추정치를 제공하며, 이를 사용하여 통계에 대한 신뢰 구간을 계산할 수 있습니다.

다음 단계별 예에서는 Excel에서 부트스트랩하는 방법을 보여줍니다.

1단계: 원본 데이터 입력

먼저 데이터 세트의 값을 입력합니다.

2단계: 부트스트랩 예제 생성

다음으로, 다음 공식을 사용하여 부트스트랩 예제를 생성하겠습니다.

 =INDEX( $A$2:$A$16 , RANDBETWEEN(1, ROWS( $A$2:$A$16 )),1)

D2 셀에 이 수식을 입력하여 원래 데이터 세트에서 값을 무작위로 선택할 수 있습니다.

그런 다음 이 공식을 10개 셀 오른쪽으로 드래그하여 첫 번째 부트스트랩 샘플을 생성할 수 있습니다.

그런 다음 이 수식을 300개 행 위로 끌어서 300개의 부트스트랩 샘플을 생성할 수 있습니다.

Excel의 부트스트랩

참고 : 부트스트랩은 대체 샘플링을 사용합니다. 이는 원본 데이터세트의 값이 특정 샘플에 여러 번 나타날 수 있음을 의미합니다.

3단계: 각 샘플에 대한 관심 통계 계산

그런 다음 각 샘플에 대한 관심 통계를 계산할 수 있습니다.

예를 들어 평균, 중앙값, 표준 편차, 사분위간 범위 등을 계산할 수 있습니다. 각 샘플마다.

이 특정 예에서는 각 샘플의 중앙값을 계산합니다.

우리는 볼 수있다:

  • 첫 번째 부트스트랩 샘플의 중앙값은 14 입니다.
  • 두 번째 부트스트랩 샘플의 중앙값은 16 입니다.
  • 세 번째 부트스트랩 샘플의 중앙값은 13.5 입니다.

등등.

4단계: 부트스트랩 신뢰 구간 계산

마지막으로 N열에서 2.5% 백분위수와 97.5% 백분위수의 값을 찾아 중앙값에 대한 95% 부트스트랩 신뢰구간을 계산할 수 있습니다.

이를 위해 다음 공식을 사용할 수 있습니다.

 =PERCENTILE( N2:N301 , 0.025)

=PERCENTILE( N2:N301 , 0.975)

다음 스크린샷은 실제로 이러한 수식을 사용하는 방법을 보여줍니다.

Excel의 부트스트랩 신뢰 구간

결과에서 원본 데이터 세트의 중앙값에 대한 95% 부트스트랩 신뢰 구간이 [10.475, 19.7625] 임을 알 수 있습니다.

이 예에서는 각각 샘플 크기가 n=10인 300개의 부트스트랩 샘플을 생성하도록 선택했지만 원하는 만큼 많은 부트스트랩 샘플을 생성할 수 있습니다.

통계 소프트웨어를 사용할 때 신뢰 구간을 구성하는 데 사용할 수 있는 부트스트랩 샘플을 생성하는 것이 일반적입니다.

추가 리소스

다음 자습서에서는 Excel에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Excel에서 신뢰 구간을 계산하는 방법
Excel에서 예측 구간을 계산하는 방법
Excel에서 공차 구간을 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다