연령은 이산형 변수입니까 아니면 연속형 변수입니까?
통계에서 수치 변수는 이산형 또는 연속형으로 분류될 수 있습니다.
이산형: 정수만 사용할 수 있는 변수입니다. 예를 들어:
- 한 가족에 속한 동물의 수(1, 2, 5 등)
- 경기장 내 인원수(100, 500, 900 등)
- 병 안의 쿠키 수(3, 11, 22 등)
연속형 : 소수점 이하의 값이 여러 개인 숫자를 포함하여 임의의 숫자를 취할 수 있는 변수입니다. 예를 들어:
- 높이(70.3434277인치)
- 무게(189.5파운드)
- 시간(14.226초)
일반 규칙:
항목을 셀 수 있다면 이산형 변수를 사용하여 작업하는 것입니다(예: 경기장에 있는 사람 수 계산).
그러나 항목을 측정 할 수 있다면 키, 몸무게, 시간 등을 측정하는 연속 변수를 사용하여 작업하는 것입니다.
이 경험 법칙을 사용하면 대부분의 변수를 이산형 또는 연속형으로 쉽게 분류할 수 있습니다.
그러나 분류하기 어려운 변수 중 하나는 연령 입니다. 한편으로 사람의 나이를 연 단위(예: 40세) 로 계산할 수 있지만 정확한 숫자(예: 40,225세)로 사람의 나이를 측정 할 수도 있습니다.
그렇다면 나이는 이산변수인가요, 연속변수인가요?
연령은 이산적인가 아니면 연속적인가?
기술적으로 말하면 연령은 소수점 이하 자릿수에 관계없이 모든 값을 취할 수 있으므로 연속형 변수입니다.
사람의 생년월일을 알고 있는 경우 연, 월, 주, 일, 시간, 초 등을 포함하여 정확한 나이를 계산할 수 있습니다. 따라서 누군가는 6.225549세라고 말할 수 있습니다.
가족이 소유한 “애완동물의 수”와 같은 이산형 변수로는 동일한 작업을 수행할 수 없습니다. 예를 들어, 한 가족이 6,225,549마리의 애완동물을 키운다고 말할 수는 없습니다. 그들은 6~7마리의 애완동물을 키우고 있습니다.
그러나 일부 유형의 통계 분석을 수행할 때 연령은 거의 항상 이산형 변수로 처리됩니다.
이를 설명하기 위해 다음 예를 고려하십시오.
예 1: 의학 연구에서 연령 사용
의료 전문가가 나이, 식습관, 운동이 혈압에 어떤 영향을 미치는지 알고 싶어하는 연구를 수행하고 있다고 가정해 보겠습니다.
연구에 참여하는 개인의 데이터를 수집할 때 27세, 30세, 45세 등과 같은 정수를 사용하여 나이를 기록합니다.
연령은 기술적으로 연속형 변수이지만 이를 이산형 변수로 취급하고 정수를 사용하여 데이터만 수집합니다.
예 2: 생물학적 연구에서 연령 사용
생물학자가 식물의 키와 나이 사이의 상관관계를 이해하고 싶어한다고 가정해 보겠습니다.
개별 식물에 대한 데이터를 계산할 때 키를 센티미터 단위로 측정하고 나이를 일, 주 또는 월 단위로 측정합니다. 예를 들어, 22일, 29일, 34일 등으로 나이를 측정할 수 있습니다.
나이를 22.4543일, 29.8868일, 34.0001일 등으로 측정할 수 있지만 더 쉽기 때문에 정수를 사용하여 측정할 수도 있습니다.
요약
통계 입문 과정에서 연령이 연속형 변수인지 이산형 변수인지 묻는다면 정답은 기술적으로 연속형입니다.
그러나 현실 세계에서는 데이터를 수집하고 연구 결과를 보고할 때 나이가 더 큰 의미를 갖기 때문에 나이를 이산형 변수로 취급하는 경우가 많습니다.
추가 리소스
통계는 왜 중요한가요? (통계가 중요한 10가지 이유!)
질적 변수와 양적 변수: 차이점은 무엇인가요?
측정 수준: 명목, 순서, 간격 및 비율