그룹화된 데이터의 중앙값을 찾는 방법: 예 포함


우리는 종종 어떤 방식으로든 함께 그룹화된 데이터의 중앙값을 계산하려고 합니다.

중앙값은 모든 값이 가장 작은 값에서 가장 큰 값으로 정렬될 때 데이터 세트의 바로 중간에 있는 값을 나타냅니다.

예를 들어 다음과 같이 그룹화된 데이터가 있다고 가정합니다.

원시 데이터 값을 모르기 때문에 정확한 중앙값을 계산할 수는 없지만 다음 공식을 사용하여 중앙값을 추정하는 것은 가능합니다.

그룹화된 데이터의 중앙값 = L + W[(N/2 – C) / F]

금:

  • L : 중앙분류 하한
  • W : 중앙 클래스 너비
  • N : 총 주파수
  • C : 중앙값까지의 누적도수
  • F : 중간 등급 빈도

참고 : 중간 클래스는 N/2에 위치한 값을 포함하는 클래스입니다. 위의 예에는 N = 23개의 총 값이 있습니다. 따라서 중앙값은 위치 23/2 = 11.5이며 이는 21-30 클래스에 속합니다.

다음 예에서는 다양한 시나리오에서 그룹화된 데이터의 중앙값을 계산하는 방법을 보여줍니다.

예 1: 그룹화된 데이터의 중앙값 계산

특정 수업에서 40명의 학생이 채점한 시험을 보여주는 다음과 같은 빈도 분포가 있다고 가정합니다.

이 예에는 N = 40개의 총 값이 있습니다. 따라서 중앙값은 40/2 = 20이 위치한 클래스에 있습니다. 20번째로 큰 값은 71-80 클래스에 속합니다.

이를 알면 다음 값을 계산할 수 있습니다.

  • L : 중산층 하한 : 71
  • W : 중간 클래스 폭: 9
  • N : 총 빈도: 40
  • C : 중앙값 클래스까지의 누적도수 : 12
  • F : 중간 클래스 빈도: 15

이 값을 공식에 연결하여 분포의 중앙값을 계산할 수 있습니다.

  • 중앙값 = L + W[(N/2 – C) / F]
  • 중앙값 = 71 + 9[(40/2 – 12) / 15]
  • 중앙값 = 75.8

우리는 평균 시험 점수를 75.8 점으로 추정합니다.

예 2: 그룹화된 데이터의 중앙값 계산

60명의 농구 선수가 경기당 득점한 점수를 보여주는 다음과 같은 빈도 분포가 있다고 가정합니다.

이 예에는 N = 60개의 총 값이 있습니다. 따라서 중앙값은 60/2 = 30이 위치한 클래스에 있습니다. 30번째로 큰 값은 클래스 11-20 에 있습니다.

이를 알면 다음 값을 계산할 수 있습니다.

  • L : 중산층 하한 : 11
  • W : 중간 클래스 폭: 9
  • N : 총 주파수: 60
  • C : 중앙값까지의 누적도수 : 8
  • F : 중간 클래스 빈도: 25

이 값을 공식에 연결하여 분포의 중앙값을 계산할 수 있습니다.

  • 중앙값 = L + W[(N/2 – C) / F]
  • 중앙값 = 11 + 9[(60/2 – 8) / 25]
  • 중앙값 = 18.92

시험 점수 중앙값은 18.92 로 추정됩니다.

추가 리소스

다음 튜토리얼에서는 그룹화된 데이터를 사용하여 다른 일반적인 작업을 수행하는 방법을 설명합니다.

그룹화된 데이터의 평균과 표준편차를 찾는 방법
그룹화된 데이터 모드를 찾는 방법
그룹화된 데이터의 백분위수 순위를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다