벤포드의 법칙

이 기사에서는 벤포드의 법칙이 무엇인지 설명합니다. 또한 벤포드의 법칙이 어떻게 발견되었는지, 이 통계법칙이 어떻게 응용되는지 확인할 수 있습니다.

벤포드의 법칙이란 무엇입니까?

첫 번째 숫자의 법칙 이라고도 불리는 벤포드의 법칙 은 데이터의 첫 번째 숫자가 1일 확률이 다른 숫자일 확률보다 크다는 통계법칙입니다.

즉, 벤포드의 법칙은 실생활에 존재하는 일련의 수치 데이터에서 숫자 1이 데이터의 첫 번째 숫자로 가장 많이 반복되는 숫자임을 말합니다.

또한 숫자가 높을수록 1위를 차지할 확률이 낮아집니다. 따라서 첫 번째 숫자는 2보다 1이 될 가능성이 높지만, 3보다 2가 가능성이 높고, 4보다 3이 가능성이 더 높습니다.

Benford의 법칙은 미국인 Frank Benford의 이름에서 따왔습니다. 비록 그가 그것을 발명하지는 않았지만 Benford는 이 통계 규칙을 대중화했습니다. 아래에서 벤포드의 법칙의 유래를 살펴보겠습니다.

벤포드의 법칙 공식

벤포드의 법칙에 따르면 첫 번째 숫자가 특정 숫자일 확률은 해당 숫자에 1을 더한 로그와 같습니다.

따라서 Benford의 법칙의 공식은 다음과 같습니다.

\begin{array}{c}\displaystyle P[X=d]=\log_{10}\left(1+\frac{1}{d}\right)\\[4ex]d=1,2,3,\ldots ,9\end{array}

따라서 벤포드의 법칙 공식을 통해 각 숫자가 데이터 항목의 첫 번째 숫자일 확률을 도출할 수 있습니다. 다음 표에서 모든 확률의 백분율을 볼 수 있습니다.

수치 확률
첫 번째 숫자가 되다
1 30.1%
2 17.6%
12.5%
4 9.7%
5 7.9%
6 6.7%
7 5.8%
8 5.1%
9 4.6%

또한 아래에서는 벤포드 법칙의 모든 확률이 그래픽으로 표현된 히스토그램을 볼 수 있습니다.

벤포드의 법칙

벤포드의 법칙의 역사

1881년 수학자 사이먼 뉴컴(Simon Newcomb)은 로그표의 첫 페이지가 마지막 페이지보다 훨씬 더 많이 사용된다는 사실을 발견하면서 벤포드의 법칙을 추론했습니다. 즉, 숫자의 첫 번째 숫자는 확률이 동일하지 않지만 1이 2보다 더 자주 발생하고 2가 3보다 더 자주 발생하는 식으로 최대 9까지 발생합니다.

그러나 Newcomb은 이 규칙이 준수되었다는 통계적 증거를 남기지 않았으며 단순히 로그 테이블의 마모에서 추론을 했습니다.

나중에, 특히 1938년에 물리학자 프랭크 벤포드(Frank Benford)는 동일한 관찰을 하고 이를 경험적으로 검증하기 위해 실험도 수행했습니다. 그는 20개의 서로 다른 샘플에서 얻은 20,229개의 값으로 구성된 통계 데이터 세트에서 각 데이터의 첫 번째 숫자에 대한 연구를 수행했습니다. 그래서 결과를 바탕으로 그는 벤포드의 법칙이 충족되었음을 입증하고 첫 번째 숫자가 특정 숫자일 확률을 계산할 수 있는 공식을 추론했습니다(위에서 이 공식을 확인했습니다).

간단히 말해서, 벤포드의 법칙은 사이먼 뉴콤(Simon Newcomb)에 의해 처음 발견되었지만, 이 통계법칙을 검증한 사람이기 때문에 프랭크 벤포드(Frank Benford)의 이름을 따서 명명되었습니다.

벤포드 법칙의 응용

벤포드의 법칙은 매우 다양한 분야에 적용할 수 있는 통계법입니다. 예를 들어 벤포드의 법칙은 경제학, 생물학, 심지어 정치 분야에서도 널리 사용됩니다.

경제학에서 벤포드의 법칙은 종종 데이터 조작을 탐지하는 데 사용됩니다. 왜냐하면 데이터 세트가 벤포드의 법칙을 따르지 않으면 데이터가 조작되었음을 나타내기 때문입니다. 예를 들어 이 법은 세금 사기 가능성이 있는 사례를 탐지하는 데 사용됩니다.

벤포드의 법칙은 결과가 등가적이기 때문에 무작위 현상의 진실성을 입증하는 데 사용되지 않는다는 점에 유의해야 합니다. 따라서 Benford의 규칙은 복권 결과를 확인하는 데 사용할 수 없습니다.

반면, 유전학에서는 벤포드의 법칙을 사용하여 다양한 유기체 유형 간의 게놈 길이 차이를 분석할 수 있습니다.

마지막으로, 벤포드의 법칙을 적용하여 유권자 사기를 탐지하려는 시도도 있었지만, 이 경우의 유용성은 의문시되었습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다