밀도 곡선이란 무엇입니까? (설명 및 예시)


밀도 곡선은 데이터 집합의 값 분포를 나타내는 그래프의 곡선입니다. 이는 다음 세 가지 이유로 유용합니다.

1. 밀도 곡선은 분포에 빈도 값의 하나 이상의 “피크”가 있는지 여부와 분포가 왼쪽으로 치우쳐 있는지 여부를 포함하여 분포의 “모양”에 대한 좋은 아이디어를 제공합니다. 아니면 맞다. 오른쪽. .

2. 밀도 곡선을 통해 분포의 평균과 중앙값 의 관계를 시각적으로 확인할 수 있습니다.

3. 밀도 곡선을 사용하면 데이터 세트의 관측치 중 몇 퍼센트가 서로 다른 값 사이에 있는지 시각적으로 확인할 수 있습니다.

가장 잘 알려진 밀도 곡선은 정규 분포를 나타내는 종 모양의 곡선입니다.

밀도 곡선을 더 잘 이해하려면 다음 예를 고려하십시오.

예: 밀도 곡선 생성 및 해석

특정 밭에 있는 20가지 식물의 높이(인치 단위)를 보여주는 다음 데이터 세트가 있다고 가정해 보겠습니다.

4장, 5장, 5장, 6장, 6장, 6장, 6장, 7장, 7장, 7장, 7장, 7장, 8장, 8장, 8장, 9장, 9장, 9장, 2장, 2장

각 값의 상대 빈도를 표시하기 위해 간단한 히스토그램을 만든 경우 다음과 같습니다.

R의 상대 빈도 히스토그램

x축은 데이터 값을, y축은 상대도수를 나타냅니다(예를 들어 데이터세트의 전체 값 20개 중 “7”이라는 값이 5번 나타나므로 상대도수는 25% 또는 0.25 .

그리고 이 분포의 “모양”을 포착하기 위해 밀도 곡선을 만든 경우 다음과 같습니다.

밀도 곡선의 예

곡선은 대부분의 값이 발견되는 분포 중심 근처에서 가장 높습니다. 또한 이 값을 취하는 식물이 적기 때문에(예: 높이 4인치 또는 10인치) 분포 끝 부분에서 가장 낮습니다.

밀도 곡선을 해석하는 방법

밀도 곡선은 모양과 크기가 다양하며 이를 통해 주어진 데이터 세트의 값 분포를 시각적으로 빠르게 이해할 수 있습니다. 이는 다음을 시각화하는 데 특히 유용합니다.

1. 비대칭

왜도는 분포의 대칭성을 설명하는 방법입니다. 밀도 곡선을 사용하면 그래프가 왼쪽, 오른쪽으로 기울어졌는지 또는 기울어지지 않았는지 빠르게 확인할 수 있습니다.

왼쪽으로 치우친 밀도 곡선의 예

오른쪽으로 치우친 밀도 곡선의 예

대칭 밀도 곡선의 예

2. 평균과 중앙값의 위치

밀도 곡선의 왜도를 기반으로 주어진 분포에서 평균 또는 중앙값이 더 큰지 빠르게 알 수 있습니다. 특히:

  • 밀도 곡선이 비대칭으로 유지되면 평균이 중앙값보다 낮습니다 .
  • 밀도 곡선이 오른쪽으로 치우쳐 있으면 평균이 중앙값보다 큽니다 .
  • 밀도 곡선에 비대칭성이 없으면 평균은 중앙값 과 같습니다.

3. 피크 수

밀도 곡선을 사용하면 특정 분포에 얼마나 많은 “피크”가 있는지 빠르게 확인할 수 있습니다. 위의 각 예에서 분포에는 단 하나의 피크만 있으므로 이러한 분포를 단봉형 으로 설명합니다.

그러나 일부 분포에는 이봉 분포 라고 하는 두 개의 피크가 있을 수 있습니다. 그리고 드문 경우에는 두 개 이상의 피크가 있는 다중 모드 분포를 가질 수도 있습니다.

주어진 데이터 세트에 대한 밀도 곡선을 생성함으로써 분포에 피크가 몇 개 있는지 빠르게 확인할 수 있습니다.

밀도 곡선의 속성

밀도 곡선에는 다음과 같은 속성이 있습니다.

  • 곡선 아래 면적의 합은 항상 100%입니다.
  • 곡선은 결코 x축 아래로 내려가지 않습니다.

다양한 분포에 대한 밀도 곡선을 생성하거나 해석할 때 이 두 가지 사실을 염두에 두십시오.

추가 리소스

상대 빈도 히스토그램 소개
Excel에서 종형 곡선을 만드는 방법
Python에서 종형 곡선을 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다