Python에서 런타임 테스트를 수행하는 방법
실행 테스트는 데이터 세트가 무작위 프로세스에서 나온 것인지 여부를 확인하는 데 사용되는 통계 테스트입니다.
검정의 귀무가설과 대립가설은 다음과 같습니다 .
H 0 (null): 데이터가 무작위로 생성되었습니다.
H a (대체): 데이터가 무작위로 생성되지 않았습니다 .
이 튜토리얼에서는 Python에서 테스트 실행을 수행하는 데 사용할 수 있는 두 가지 방법을 설명합니다.
예: Python에서 테스트 실행
다음 구문을 사용하는 statsmodels 라이브러리의 runtest_1samp() 함수를 사용하여 Python에서 특정 데이터세트에 대해 테스트 실행을 수행할 수 있습니다.
runtest_1samp(x, 컷오프=’평균’, 수정=True)
금:
- x: 데이터 값의 배열
- 컷오프(cutoff): 데이터를 큰 값과 작은 값으로 나누는 데 사용하는 임계값입니다. 기본값은 “평균”이지만 “중앙값”을 대안으로 지정할 수도 있습니다.
- 수정: 샘플 크기가 50 미만인 경우 이 기능은 수정으로 0.5를 뺍니다. False를 지정하여 이 수정 사항을 비활성화할 수 있습니다.
이 함수는 az 검정 통계량과 해당 p-값을 출력으로 생성합니다.
다음 코드는 Python에서 이 함수를 사용하여 테스트 실행을 수행하는 방법을 보여줍니다.
from statsmodels. sandbox . stats . runs import runstest_1samp #create dataset data = [12, 16, 16, 15, 14, 18, 19, 21, 13, 13] #Perform Runs test runstest_1samp(data, correction= False ) (-0.6708203932499369, 0.5023349543605021)
z-test 통계는 -0.67082 이고 해당 p-값은 0.50233 입니다. 이 p-값은 α = 0.05 이상이므로 귀무가설을 기각할 수 없습니다. 데이터가 무작위로 생성되었다고 말할 수 있는 충분한 증거가 있습니다.
참고 : 이 예에서는 테스트 통계를 계산할 때 수정을 비활성화했습니다. 이는 테스트를 실행할 때 수정 사항을 사용하지 않는 R에서 테스트 실행을 수행하는 데 사용되는 공식과 일치합니다.