범주형 또는 양적 변수: 정의 + 예
통계에서 변수는 범주형 또는 양적 변수 로 분류될 수 있습니다.
범주형 변수: 이름이나 레이블을 취하는 변수. 예는 다음과 같습니다:
- 결혼 상태(“기혼”, “미혼”, “이혼”)
- 흡연 상태(‘흡연자’, ‘비흡연자’)
- 눈 색깔(“파란색”, “녹색”, “개암색”)
- 교육 수준(예: ‘고등학교’, ‘학사 학위’, ‘석사 학위’)
양적 변수: 숫자 값을 취하는 변수. 예는 다음과 같습니다:
- 개인의 크기
- 도시의 인구 규모
- 학급의 학생 수
- 집의 평방 피트 수
다음 표에는 이러한 두 가지 변수 유형의 차이점이 요약되어 있습니다.
예: 범주형 변수 및 양적 변수
범주형 변수와 양적 변수를 더 잘 이해하려면 다음 예를 사용하세요.
예시 1: 식물 높이
식물학자는 지역 숲을 거닐며 특정 식물종의 키를 측정합니다. 식물 높이 변수는 수치값을 취하므로 정량변수 이다. 예를 들어 높이는 15인치, 17.5인치, 19.2인치 등이 될 수 있습니다.
예시 2: 휴가용 임대 숙소
한 연구원이 200명을 인터뷰하고 그들에게 가장 좋아하는 휴양지가 어디인지 물었습니다. 휴가 장소 변수는 이름을 갖기 때문에 범주형 변수 입니다. 예를 들어 답변에는 ‘마이애미’, ‘샌프란시스코’, ‘힐튼 헤드’ 등이 포함될 수 있습니다.
예시 3: 정당
한 정치학자가 특정 도시의 50명을 인터뷰하고 그들이 어느 정당에 속해 있는지 질문합니다. 정당 변수는 레이블이 있으므로 범주형 변수 입니다. 예를 들어, 답변에는 “민주당원”, “공화당원”, “무소속” 등이 포함될 수 있습니다.
예시 4: 실행 시간
코치는 추적자 20명의 경주 시간을 기록합니다. 작동시간 변수는 수치값을 취하므로 정량변수 이다. 예를 들어 런타임은 58초, 60.343초, 65.4초 등이 될 수 있습니다.
사례 5: 주택 가격
경제학자는 특정 도시의 주택 가격에 대한 데이터를 수집합니다. 부동산 가격 변수는 수치를 취하기 때문에 양적 변수 이다. 예를 들어 주택 가격은 $149,000, $289,000, $560,000 등이 될 수 있습니다.
범주형 변수와 양적 변수를 설명하는 방법
빈도표를 사용하여 범주형 변수를 요약할 수 있습니다.
예를 들어 100명의 눈 색깔에 대한 데이터를 수집한다고 가정해 보겠습니다. “눈 색깔”은 범주형 변수이므로 다음 빈도표를 사용하여 해당 값을 요약할 수 있습니다.
다양한 기술통계를 이용하여 정량변수를 요약할 수 있습니다.
예를 들어 주택 100채의 면적에 대한 데이터를 수집한다고 가정해 보겠습니다. “평방피트”는 양적 변수이므로 다음과 같은 기술 통계를 사용하여 해당 값을 요약할 수 있습니다.
- 평균: 1,800
- 중앙값: 2,150
- 모드: 1600
- 범위: 6,500
- 사분위수 척도: 890
- 표준편차: 235
이러한 측정항목은 중심 값이 어디에 있는지와 해당 변수에 대한 값의 분포에 대한 아이디어를 제공합니다.
관련 항목: R에서 범주형 데이터를 그리는 방법