이분형 변수

이 기사에서는 이분형 변수가 무엇인지 설명합니다. 따라서 통계에서 더미변수가 무엇을 의미하는지, 더미변수의 예, 더미변수와 선형회귀의 관계에 대해 알아봅니다.

이분형 변수란 무엇입니까?

통계에서 이 분형 변수는 두 개의 값만 취할 수 있는 변수입니다. 따라서 이분형 변수는 1 또는 0의 값만 가질 수 있으며 각 값은 가능한 두 가지 옵션 중 하나에 해당합니다.

예를 들어, 개인의 성별은 남성 또는 여성만 될 수 있으므로 이분형 변수입니다.

이분형 변수는 이분형 변수 라고도 합니다.

또한 이분형 변수는 범주형 변수와 질적 변수로 분류될 수 있기 때문에 특별한 유형의 통계 변수입니다.

마지막으로, 이분형 변수의 의미를 기억하는 데 도움을 주기 위해 이 단어는 그리스어로 2를 의미하는 접두사 di- 에서 유래되었습니다.

이분형 변수의 예

이분형 변수의 정의를 살펴본 후 이러한 유형의 변수에 대한 몇 가지 예를 살펴보고 개념 이해를 마무리하겠습니다.

  • 실험의 결과는 ‘성공’일 수도 있고 ‘실패’일 수도 있습니다.
  • 개인의 건강 상태 : “건강” 또는 “아프다”일 수 있습니다.
  • 시험 결과 : 획득한 성적은 ‘합격’ 또는 ‘불합격’으로 이분화될 수 있습니다.
  • 질문에 대한 답변 : 질문에 ‘예’, ‘아니오’ 등 두 가지 답변만 허용되는 경우 이분형 변수입니다.
  • 외동아인지 아닌지 : 형제자매가 없으면 이분형 변수는 0, 그렇지 않으면 이분형 변수는 1이다.
  • 책을 읽었는지 여부에 대한 사실 : ‘읽음’ 또는 ‘읽지 않음’일 수 있습니다.
  • 작업장에 있는 자동차의 상태 : “수리됨” 또는 “수리되지 않음”일 수 있습니다.
  • 무승부 결과 : “앞면” 또는 “뒷면”만 있을 수 있습니다.

연속형 변수도 이분화될 수 있습니다. 예를 들어 연속형 변수인 집단의 규모는 ‘1.80m 이상’, ‘1.80m 이하’ 두 가지 값만 허용하면 이분형 변수로 변환될 수 있다.

이분형 및 다원형 변수

이 섹션에서는 다분형 변수가 무엇인지, 이분형 변수와 어떻게 다른지 살펴보겠습니다.

다형성 변수(Polytomous Variable)는 세 개 이상의 값을 가질 수 있는 변수 유형입니다. 예를 들어, 사람이 좋아하는 색은 “노란색”, “빨간색”, “녹색”, “파란색”, “보라색” 등이 될 수 있으므로 다원형 변수입니다.

간단히 말해서, 이 두 가지 유형의 변수는 취할 수 있는 값의 개수가 근본적으로 다릅니다.

선형 회귀 분석의 이분형 변수

통계에서 더미변수는 명목 데이터에 번호를 매길 수 있기 때문에 매우 유용합니다. 예를 들어 더미변수는 선형 회귀 분석에 명목 데이터를 포함하는 데 사용됩니다.

따라서 사람이 남자인지 여자인지 여부가 실험 결과에 영향을 미치는지 알아보고 싶다면 더미 변수를 사용하여 이 특성을 선형 회귀 모형(0 = 남자, 1 = 여자)에 포함시킬 수 있습니다. 그리고 남성인지 여성인지에 따라 데이터를 분리합니다.

또한 두 개 이상의 가능한 범주가 있는 질적 변수는 여러 더미 변수를 사용하여 모델링할 수 있습니다. 구체적으로, 정성변수에 m개의 범주가 있는 경우 선형회귀모형의 모든 옵션을 포함하려면 m-1개의 더미변수를 추가해야 합니다.

선형 회귀에 대해 자세히 알아보려면 당사 웹사이트에 있는 기사를 확인하세요.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다