Excel의 box-cox 변환(단계별)


박스콕스 변환(box-cox 변환)은 비정규 분포 데이터 세트를 보다 정규 분포된 세트로 변환하는 데 일반적으로 사용되는 방법입니다.

기본 아이디어는 다음 공식을 사용하여 변환된 데이터가 정규 분포에 최대한 가깝도록 λ 값을 찾는 것입니다.

  • y(λ) = (y λ – 1) / y ≠ 0인 경우 λ
  • y(λ) = log(y) y = 0인 경우

다음 단계별 예에서는 Excel의 데이터 세트에 대해 Box-Cox 변환을 수행하는 방법을 보여줍니다.

1단계: 데이터 입력

데이터 세트의 값을 입력하는 것부터 시작해 보겠습니다.

2단계: 데이터 정렬

그런 다음 인덱스 열과 정렬된 데이터 열을 만듭니다.

3단계: Lambda에 대한 임의 값 선택

다음으로, 람다에 대해 임의의 값 1을 선택하고 임시 box-cox 변환을 데이터에 적용합니다.

4단계: Z 점수 계산

다음으로 각 인덱스 값에 대한 z-점수를 계산합니다.

그런 다음 box-cox 변환 값과 z-점수 간의 상관 관계를 계산합니다.

5단계: 최적의 람다 값 찾기

다음으로 Goal Seek을 사용하여 Box-Cox 변환에 사용할 최적의 람다 값을 찾습니다.

이렇게 하려면 상단 리본에 있는 데이터 탭을 클릭하세요. 그런 다음 예측 그룹에서 가정 분석을 클릭합니다.

드롭다운 메뉴에서 목표 검색을 클릭하고 다음 값을 입력합니다.

Excel의 Box-Cox 변환

OK 를 클릭하면 Goal Seek이 최적의 람다 값인 -0.5225를 자동으로 찾습니다.

6단계: Box-Cox 변환 수행

마지막으로 -0.5225의 람다 값을 사용하여 원래 데이터에 box-cox 변환을 적용합니다.

보너스: Excel에서 Jarque-Bera 테스트를 수행하면 변환된 데이터가 정규 분포를 따르는 것을 확인할 수 있습니다.

추가 리소스

Excel에서 데이터를 변환하는 방법(로그, 제곱근, 세제곱근)
Excel에서 Z 점수를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다