年齢は離散変数ですか、それとも連続変数ですか?
統計では、数値変数は離散または連続として分類できます。
離散型:整数のみを受け取ることができる変数。例えば:
- 家族に属する動物の数 (1、2、5 など)
- スタジアムの収容人数 (100、500、900 など)
- 瓶の中のクッキーの数 (3、11、22 など)
連続:小数点以下に複数の値を持つ数値を含む、任意の数値を取ることができる変数。例えば:
- 高さ (70.3434277 インチ)
- 重量 (189.5 ポンド)
- 時間 (14.226 秒)
原則:
アイテムを数えることができる場合は、離散変数を操作していることになります。たとえば、スタジアムの人数を数えることなどです。
しかし、アイテムを測定できれば、身長、体重、時間などを測定するなど、連続変数を扱うことになります。
この経験則を使用すると、ほとんどの変数を離散または連続として簡単に分類できます。
ただし、分類するのが難しい変数の 1 つは年齢です。人の年齢を年単位 (例: 40 歳) で数えることができる一方で、人の年齢を正確な数字 (例: 40,225 歳) で測定することもできます。
では、年齢は離散変数ですか、それとも連続変数ですか?
年齢は離散的ですか、それとも連続的ですか?
技術的に言えば、年齢は小数点以下の桁数に関係なく任意の値を取ることができるため、連続変数です。
人の生年月日がわかっている場合は、年、月、週、日、時間、秒などを含めて正確な年齢を計算できます。したがって、誰かの年齢は 6.225549 歳であると言えます。
家族が「飼っているペットの数」のような離散変数では同じことを行うことはできません。たとえば、ある家族が 6,225,549 匹のペットを飼っているとは言えません。彼らは6、7匹のペットを飼っています。
ただし、ある種の統計分析を実行する場合、ほとんどの場合、年齢は離散変数として扱われます。
これを説明するために、次の例を考えてみましょう。
例 1: 医学研究における年齢の使用
医療専門家が、年齢、食事、運動が血圧にどのような影響を与えるかを知りたい研究を実施しているとします。
研究に参加している個人のデータを収集する場合、27 歳、30 歳、45 歳などの整数を使用して年齢が記録されます。
年齢は技術的には連続変数ですが、離散変数として扱われ、整数を使用したデータのみが収集されます。
例 2: 生物学的研究における年齢の使用
生物学者が草丈と樹齢の相関関係を理解したいと考えているとします。
個々の植物のデータを計算する場合、植物の高さをセンチメートル単位で測定し、樹齢を日、週、または月単位で測定します。たとえば、22 日、29 日、34 日などの年齢を測定できます。
年齢は 22.4543 日、29.8868 日、34.0001 日などとして測定できますが、簡単なため整数を使用して測定することになるでしょう。
まとめ
統計入門コースで年齢が連続変数か離散変数かと尋ねられた場合、技術的には連続変数が正しい答えになります。
ただし、現実の世界では、年齢はデータを収集するときや研究結果を報告するときに大きな意味を持つため、離散変数として扱われることがよくあります。
追加リソース
なぜ統計が重要なのでしょうか? (統計が重要である 10 の理由!)
質的変数と量的変数: 違いは何ですか?
測定レベル: 名目、順序、間隔、比率