단변량 분석이란 무엇입니까? (정의 & #038; 예)


단변량 분석이라는 용어는 하나의 변수에 대한 분석을 의미합니다. 접두사 “uni”가 “하나”를 의미하기 때문에 이것을 기억할 수 있습니다.

일변량 분석의 목표는 단일 변수에 대한 값의 분포를 이해하는 것입니다. 이 유형의 분석을 다음과 비교할 수 있습니다.

  • 이변량 분석 : 두 변수를 분석합니다.
  • 다변량 분석: 두 개 이상의 변수를 분석합니다.

예를 들어 다음과 같은 데이터 세트가 있다고 가정해 보겠습니다.

값의 분포를 더 잘 이해하기 위해 데이터 세트의 개별 변수 중 하나에 대해 단변량 분석을 수행하도록 선택할 수 있습니다.

예를 들어, 가구 규모 변수에 대한 단변량 분석을 수행하도록 선택할 수 있습니다.

단변량 분석의 예

단변량 분석을 수행하는 세 가지 일반적인 방법은 다음과 같습니다.

1. 요약통계

단변량 분석을 수행하는 가장 일반적인 방법은 요약 통계를 사용하여 변수를 설명하는 것입니다.

요약 통계에는 두 가지 일반적인 유형이 있습니다.

  • 중심 경향 측정 : 이 숫자는 데이터 세트의 중심이 어디에 있는지를 나타냅니다. 예로는 평균중앙값이 있습니다.
  • 분산 측정값 : 이 숫자는 데이터 세트의 값 분포를 설명합니다. 예로는 구간 , 사분위간 범위 , 표준편차, 분산 등이 있습니다.

2. 빈도 분포

단변량 분석을 수행하는 또 다른 방법은 데이터 세트에 서로 다른 값이 나타나는 빈도를 설명하는 빈도 분포를 만드는 것입니다.

3. 그래픽

일변량 분석을 수행하는 또 다른 방법은 그래프를 만들어 특정 변수에 대한 값의 분포를 시각화하는 것입니다.

일반적인 예는 다음과 같습니다.

  • 상자 그림
  • 히스토그램
  • 밀도 곡선
  • 카망베르

다음 예는 이전에 언급한 데이터 세트의 가구 규모 변수를 사용하여 각 유형의 단변량 분석을 수행하는 방법을 보여줍니다.

단변량 분석의 예

요약 통계

가구 규모의 중심 경향을 측정하는 방법은 다음과 같습니다.

  • 평균(평균값): 3.8
  • 중앙값(평균값): 4

이러한 값은 “중앙” 값이 어디에 있는지에 대한 아이디어를 제공합니다.

또한 다음과 같은 분산 측정값을 계산할 수도 있습니다.

  • 범위(최대와 최소의 차이): 6
  • 사분위수 척도(값의 중간 50% 분포): 2.5
  • 표준편차(평균 스프레드 측정): 1.87

이 값은 이 변수 값의 분포에 대한 아이디어를 제공합니다.

빈도 분포

또한 다양한 값이 발생하는 빈도를 요약하기 위해 다음과 같은 빈도 분포표를 만들 수도 있습니다.

이를 통해 우리는 가장 일반적인 가구 규모가 4명 이라는 것을 빠르게 알 수 있습니다.

자원:빈도 계산기를 사용하여 모든 변수에 대한 빈도 분포를 자동으로 생성할 수 있습니다.

제도법

가구 규모에 대한 값 분포를 시각화하는 데 도움이 되는 다음 그래프를 만들 수 있습니다.

1. 상자 그림

상자 그림 데이터 세트의 5자리 요약을 보여주는 그래프입니다.

5개 숫자 요약에는 다음이 포함됩니다.

  • 최소값
  • 첫 번째 사분위수
  • 중앙값
  • 3분위수
  • 최대값

가구 규모 변수에 대한 상자 그림은 다음과 같습니다.

자원:상자 그림 생성기를 사용하여 모든 변수에 대한 상자 그림을 자동으로 생성할 수 있습니다.

2. 히스토그램

히스토그램은 수직 막대를 사용하여 빈도를 표시하는 차트 유형입니다. 이 유형의 차트는 데이터 세트의 값 분포를 시각화하는 유용한 방법입니다.

가구 규모 변수에 대한 히스토그램은 다음과 같습니다.

3. 밀도곡선

밀도 곡선은 데이터 집합의 값 분포를 나타내는 그래프의 곡선입니다.

이는 분포에 빈번한 값의하나 이상의 “피크”가 있는지 여부, 분포가 왼쪽이나 오른쪽으로 치우쳐 있는지 여부 등 분포 의 “모양”을 시각화하는 데 특히 유용합니다.

가구 규모 변수에 대한 밀도 곡선은 다음과 같습니다.

4. 원형 차트

원형 차트는 원형 차트의 일종으로 조각을 사용하여 전체의 비율을 나타냅니다.

가구 규모 변수에 대한 원형 차트는 다음과 같습니다.

데이터 유형에 따라 이러한 차트 중 하나가 값 분포를 시각화하는 데 다른 차트보다 더 유용할 수 있습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다