R에서 부트스트랩 표준 오류를 계산하는 방법

에 의해 벤자민 앤더슨 7월 25, 2023 가이드 댓글 0개

부트스트래핑은 평균의 표준 오차를 추정하는 데 사용할 수 있는 방법입니다.

부트스트랩 표준 오류를 계산하는 기본 프로세스는 다음과 같습니다.

주어진 데이터 세트에서 k개의 반복 샘플을 복원하여 추출합니다.
각 표본에 대해 표준 오차를 계산합니다. s/ √n
이로 인해 표준 오차에 대한 k 개의 서로 다른 추정치가 생성됩니다. 부트스트랩 표준 오류를 찾으려면 k 표준 오류의 평균을 구하십시오.

다음 예에서는 R에서 부트스트랩 표준 오류를 계산하는 데 사용할 수 있는 두 가지 방법을 설명합니다.

방법 1: 스타터 패키지 사용

R에서 부팅 표준 오류를 계산하는 한 가지 방법은 부팅 라이브러리의 boot() 함수를 사용하는 것입니다.

다음 코드는 R에서 주어진 데이터 세트에 대한 부트스트랩 표준 오류를 계산하는 방법을 보여줍니다.

 #make this example reproducible
set. seeds (10)

#load boot library
library (boot)

#define dataset
x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

#define function to calculate mean
meanFunc <- function (x,i){mean(x[i])}

#calculate standard error using 100 bootstrapped samples
boot(x, meanFunc, 100)

Bootstrap Statistics:
    original bias std. error
t1* 21.5 0.254 2.379263

21.5 의 “원래” 값은 원래 데이터세트의 평균을 나타냅니다. “표준. 2.379263 값은 평균의 부트스트랩 표준 오차를 나타냅니다.

이 예에서는 평균의 표준 오차를 추정하기 위해 100개의 부트스트랩 샘플을 사용했지만 1,000, 10,000개 또는 원하는 만큼의 부트스트랩 샘플을 사용할 수도 있었습니다.

방법 2: 나만의 공식 작성

부트스트랩 표준 오류를 계산하는 또 다른 방법은 자체 함수를 작성하는 것입니다.

다음 코드는 이를 수행하는 방법을 보여줍니다.

 #make this example reproducible
set. seeds (10)

#load boot library
library (boot)

#define dataset
x <- c(12, 14, 14, 15, 18, 21, 25, 29, 32, 35)

mean(replicate(100, sd( sample (x, replace= T ))/sqrt( length (x))))

[1] 2.497414

부트스트랩된 표준 오류는 2.497414 입니다.

이 표준 오차는 이전 예에서 계산된 것과 매우 유사합니다.

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기

방법 1: 스타터 패키지 사용

방법 2: 나만의 공식 작성

저자 소개

벤자민 앤더슨

의견을 추가하다