통계에서 모드가 중요한 이유는 무엇입니까?


모드는 데이터 세트에서 가장 자주 나타나는 값을 나타냅니다.

데이터 세트에는 모드가 없거나(값이 반복되지 않는 경우), 단일 모드 또는 다중 모드가 있을 수 있습니다.

예를 들어 다음 데이터 세트의 모드는 19입니다.

데이터세트: 3, 4, 11, 15, 19 , 19, 19 , 22 , 22, 23, 23, 26

가장 자주 나타나는 값입니다.

통계에서 모드는 다음과 같은 이유로 중요합니다.

이유 1 : 이를 통해 데이터 세트의 어떤 값이 가장 일반적인지 알 수 있습니다.

이유 2 : 평균과 중앙값을 계산할 수 없는 경우 범주형 데이터에서 가장 빈번한 값을 찾는 데 유용합니다.

이유 3 : 중앙값과 평균값이 더 일반적으로 사용되지만(이 문서의 뒷부분에서 살펴보겠지만) 데이터 세트의 “중심”이 어디에 있는지 알 수 있습니다.

다음 예에서는 이러한 각 이유를 실제로 보여줍니다.

이유 1: 모드는 가장 일반적인 값을 알려줍니다.

미국 주택 판매 가격이 포함된 100,000개 행의 데이터세트가 있다고 가정해 보겠습니다.

Excel , R , Python 등과 같은 통계 소프트웨어를 사용하여 이 데이터 세트의 모드를 계산하고 세 가지 모드가 있음을 알아냈다고 가정합니다.

  • $280,000
  • $300,000
  • $305,000

이는 데이터 세트에서 가장 일반적인 주택 가격에 대한 아이디어를 즉시 제공합니다.

모드 천을 계산하는 것은 데이터 행을 보고 가장 자주 발생하는 주택 가격을 식별하는 것보다 훨씬 빠릅니다.

이유 2: 이 모드는 범주형 데이터에서 가장 일반적인 값을 검색합니다.

특정 동네의 개인이 소유한 자동차의 색상을 알려주는 1,000개 행의 데이터세트가 있다고 가정해 보겠습니다.

“color” 변수는 범주형 변수 입니다. 즉, 값이 범주(“빨간색”, “노란색”, “검은색” 등)에 속하므로 평균이나 중앙값과 같은 정량적 값을 계산할 수 없습니다. .

그러나 모드는 단순히 데이터 세트에서 가장 일반적인 값을 나타내기 때문에 계산할 수 있습니다.

예를 들어 통계 소프트웨어를 사용하여 이 데이터 세트의 모드가 “검은색”인지 확인할 수 있습니다. 이는 이 데이터 세트에서 가장 일반적인 자동차 색상이 검은색임을 알려줍니다.

이유 3: 모드는 데이터 세트의 중심이 어디에 있는지 알려줍니다.

모드는 또한 중심 경향의 척도로 간주됩니다. 즉, 데이터 세트의 “중심”이 어디에 있는지에 대한 아이디어를 제공할 수 있습니다.

예를 들어, 한 학급에 속한 20명의 서로 다른 학생의 시험 점수를 보여주는 다음 데이터 세트가 있다고 가정합니다.

모드는 82 로 밝혀졌습니다. 이는 가장 일반적인 시험 점수입니다. 이는 또한 이 데이터 세트에서 “핵심” 리뷰 점수 값이 어디에 있는지를 나타내는 좋은 지표임이 밝혀졌습니다.

그러나 다음과 같은 시험 결과 데이터세트가 있다고 가정해 보겠습니다.

이 데이터 세트에서 72 는 패션 시험 점수입니다. 그러나 이는 시험의 “핵심” 점수가 어디에 있는지를 제대로 나타내지 못하는 것으로 나타났습니다.

평균 시험 점수는 82.9 이고 중간 시험 점수는 82.5 입니다. 두 가지 모두 패션과 관련하여 “중심” 값이 어디에 있는지 더 잘 알 수 있게 해줍니다.

요약

다음은 이 기사에서 다룬 주요 내용을 간략하게 요약한 것입니다.

  • 모드는 데이터 세트에서 가장 자주 나타나는 값을 나타냅니다.
  • 최빈값은 평균과 중앙값을 사용할 수 없을 때 범주형 데이터에서 가장 일반적인 값을 알려줍니다.
  • 모드는 데이터 세트의 “중심”이 어디에 있는지에 대한 아이디어를 제공하지만 평균이나 중앙값과 비교할 때 오해의 소지가 있을 수 있습니다.

추가 리소스

다음 자습서에서는 통계의 평균, 중앙값 및 최빈값에 대한 추가 정보를 제공합니다.

통계에서 평균이 중요한 이유는 무엇입니까?
통계에서 중앙값이 중요한 이유는 무엇입니까?
구체적인 예: 평균, 중앙값 및 최빈값 사용
평균 대 사용 시기 중앙값: 예시 포함

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다