회귀 분석의 다중 공선성은 둘 이상의 예측 변수가 서로 높은 상관 관계를 갖고 있어 회귀 모델에서 고유하거나 독립적인 정보를 제공하지 않는 경우에 발생합니다. 변수 간의 상관 정도가 충분히 높으면 회귀 모델을 피팅하고 해석할 때 문제가 발생할 수 있습니다. 다중 공선성을 탐지하는...
이 튜토리얼은 다음을 포함하여 최고의 ggplot2 테마에 대한 완전한 가이드를 제공합니다. 내장된 ggplot2 테마를 사용하여 플롯의 모양을 변경하는 방법. ggthemes 라이브러리에서 사전 정의된 테마를 사용하여 플롯의 모양을 변경하는 방법. 경로 패널 배경 및 격자선을 포함하여 테마의 특정 구성 요소를 편집하는 방법....
이 가이드에서는 다음을 포함하여 R에서 다중 선형 회귀를 수행하는 방법의 예를 보여줍니다. 모델을 피팅하기 전에 데이터 검사 모델 조정 모델 가정 확인 모델 출력 해석 모델 적합도 평가 모델을 사용하여 예측하기 갑시다! 시설 이 예에서는 32가지 자동차의 다양한 속성에 대한 정보가...
Di로 표시되는 Cook의 거리(Cook’s distance)는 회귀 분석 에서 회귀 모델에 부정적인 영향을 줄 수 있는 영향력 있는 데이터 포인트를 식별하는 데 사용됩니다. Cook의 거리 공식은 다음과 같습니다. d i = (ri 2 / p*MSE) * (h ii / (1-h ii )...
양방향 빈도표는 두 범주형 변수의 빈도(또는 “개수”)를 표시하는 표입니다. 예를 들어, 다음 양방향 표는 100명에게 야구, 농구, 축구 중 어떤 스포츠를 선호하는지 묻는 설문 조사 결과를 보여줍니다. 행에는 응답자의 성별이 표시되고 열에는 응답자가 선택한 스포츠가 표시됩니다. 성별 과 좋아하는 스포츠 라는...
많은 통계 테스트(예: 일원 분산 분석 또는 양방향 분산 분석 )에서는 여러 그룹 간의 분산이 동일하다고 가정합니다. 이 가설을 공식적으로 테스트하는 한 가지 방법은 둘 이상의 그룹 간의 분산이 동일한지 여부를 테스트하는 Levene 테스트를 사용하는 것입니다. 이 테스트는 다음과 같은 가정을...
“분위수-분위수”의 약자인 QQ 플롯은 데이터 세트가 잠재적으로 이론적 분포에서 나오는지 여부를 결정하는 데 사용할 수 있는 플롯 유형입니다. 많은 통계 테스트에서는 데이터 세트가 정규 분포를 따른다고 가정하고 QQ 플롯은 이 가정이 충족되는지 여부를 평가하는 데 자주 사용됩니다. QQ 플롯은 공식적인 통계...
이 튜토리얼에서는 로지스틱 회귀 모델의 C 통계를 해석하는 방법에 대한 간단한 설명을 제공합니다. 로지스틱 회귀란 무엇입니까? 로지스틱 회귀는 응답 변수가 이진일 때 회귀 모델을 맞추는 데 사용하는 통계 방법입니다. 다음은 로지스틱 회귀를 사용하는 몇 가지 예입니다. 우리는 운동, 식이요법 및 체중이...
데이터 세트의 n번째 백분위수 는 모든 값을 가장 작은 값에서 가장 큰 값으로 정렬할 때 데이터 값의 처음 n %를 잘라내는 값입니다. 예를 들어, 데이터 세트의 90번째 백분위수는 데이터 값의 하위 90%와 데이터 값의 상위 10%를 구분하는 값입니다. 가장 일반적으로 사용되는...
대응 표본 t-검정은 한 표본의 각 관측치가 다른 표본의 관측치 와 일치할 수 있을 때 두 표본의 평균을 비교하는 통계 검정입니다. 예를 들어, 특정 커리큘럼이 학생들의 특정 시험 성적에 중요한 영향을 미치는지 알고 싶다고 가정해 보겠습니다. 이를 테스트하기 위해 우리는 한...