二値変数
この記事では、二分変数とは何かについて説明します。そこで、統計におけるダミー変数の意味、ダミー変数の例、ダミー変数と線形回帰の関係について学びます。
二分変数とは何ですか?
統計学において、二分変数とは、2 つの値のみを取ることができる変数です。したがって、二値変数は 1 または 0 の値のみを持つことができ、各値は 2 つの可能なオプションの 1 つに対応します。
たとえば、人の性別は男性か女性のみであるため、二分変数です。
二値変数は、バイナリ変数とも呼ばれます。
さらに、二値変数は、カテゴリ変数と質的変数の両方として分類できるため、特殊なタイプの統計変数です。
最後に、二値変数の意味を覚えやすくするために、この単語はギリシャ語で2 を意味する接頭辞di-に由来しています。
二値変数の例
二値変数の定義を理解したら、このタイプの変数の例をいくつか見て、概念の理解を完了します。
- 実験の結果は「成功」もあれば「失敗」もある。
- 人の健康状態: 「健康」または「病気」の場合があります。
- 試験の結果:得られた成績は「合格」か「不合格」に二分されます。
- 質問に対する答え: 質問で「はい」と「いいえ」など 2 つの回答のみが許可されている場合、それは二分変数です。
- 人が一人っ子であるかどうか: その人に兄弟がいない場合、二分変数は 0 であり、そうでない場合、二分変数は 1 です。
- 本を読んだかどうかという事実: それは「読んだ」ことも「読んでいない」こともできます。
- 工場での車の状態: 「修理済み」または「未修理」の場合があります。
- 引き分けの結果: 「表」または「裏」のみが存在します。
連続変数も二分化できることに注意してください。たとえば、人のグループのサイズは連続変数ですが、「1.80 m を超える」または「1.80 m 以下」の 2 つの値のみが許可される場合は、二値変数に変換できます。
二値変数と多値変数
このセクションでは、多値変数とは何か、またそれが二値変数とどのように異なるのかを見ていきます。
多値変数は、 3 つ以上の値を取ることができる変数のタイプです。たとえば、人の好きな色は、「黄色」、「赤」、「緑」、「青」、「紫」などになる可能性があるため、多色変数です。
つまり、これら 2 種類の変数は、取り得る値の数が根本的に異なります。
線形回帰における二分変数
統計では、ダミー変数を使用すると名目データに番号を付けることができるため、非常に便利です。たとえば、ダミー変数は線形回帰に名目データを含めるために使用されます。
したがって、人が男性であるか女性であるという事実が実験の結果に影響するかを調べたい場合は、ダミー変数を使用してこの特徴を線形回帰モデルに含めることができます (0 = 男性、1 = 女性)。データを男性か女性かに応じて分離します。
さらに、2 つ以上の可能なカテゴリを持つ質的変数は、複数のダミー変数を使用してモデル化できます。具体的には、質的変数にmカテゴリがある場合、線形回帰モデルのすべてのオプションを含めるためにm-1 個のダミー変数を追加する必要があります。
線形回帰について詳しくは、Web サイトにある記事をご覧ください。