선형 회귀 분석의 주요 가정 중 하나는 잔차가 예측 변수의 각 수준에서 등분산으로 분포된다는 것입니다. 이 가정을 등분산성(homoscedasticity) 이라고 합니다. 이 가정이 존중되지 않으면 잔차에 이분산성이 존재한다고 합니다. 이런 일이 발생하면 회귀 결과를 신뢰할 수 없게 됩니다. 이 문제를 해결하는 한...
“표준 점수 9″의 약자인 Stanine 점수는 표준 9점 척도로 시험 점수를 조정하는 방법입니다. 이 방법을 사용하면 각 테스트 결과를 원래 점수(예: 0~100)에서 1~9 사이의 숫자로 변환할 수 있습니다. 테스트 결과를 Stanine 점수에 맞게 조정하기 위해 간단한 2단계 프로세스를 사용합니다. 1. 각...
통계에서 십분위수는 데이터 세트를 동일한 빈도의 10개 그룹으로 나누는 숫자입니다. 첫 번째 십분위수는 전체 데이터 값의 10%가 아래로 떨어지는 지점이다. 두 번째 십분위수는 전체 데이터 값의 20%가 아래로 떨어지는 지점 등입니다. 다음 함수를 사용하여 Excel에서 데이터 세트의 십분위수를 계산할 수 있습니다....
잔차는 회귀 모델에서 관측된 값과 예측된 값 간의 차이입니다. 다음과 같이 계산됩니다. 잔차 = 관측값 – 예측값 회귀 모델이 데이터 세트에 얼마나 잘 맞는지 이해하는 한 가지 방법은 다음과 같이 계산되는 잔차 제곱합을 계산하는 것입니다. 잔차 제곱합 = Σ(e i )...
잔차는 회귀 모델에서 관측된 값과 예측된 값 간의 차이입니다. 다음과 같이 계산됩니다. 잔차 = 관측값 – 예측값 회귀 모델이 데이터 세트에 얼마나 잘 맞는지 이해하는 한 가지 방법은 다음과 같이 계산되는 잔차 제곱합을 계산하는 것입니다. 잔차 제곱합 = Σ(e i )...
선형 회귀의 주요 가정 중 하나는 잔차가 정규 분포를 따른다는 것입니다. 이 가정을 시각적으로 검증하는 한 가지 방법은 잔차의 히스토그램을 만들고 분포가 정규 분포를 연상시키는 “종 모양”을 따르는지 관찰하는 것입니다. 이 튜토리얼에서는 R에서 회귀 모델에 대한 잔차 히스토그램을 만드는 방법에 대한...
이상값 은 데이터 세트의 다른 값과 비정상적으로 멀리 떨어져 있는 관측값 입니다. 이상값은 분석 결과에 영향을 미칠 수 있으므로 문제가 될 수 있습니다. 데이터 세트에서 이상값을 감지하는 일반적인 방법은 사분위간 범위를 사용하는 것입니다. 종종 IQR로 약칭되는 사분위수 범위는 데이터 세트에서 25번째...
종종 통계에서 우리는 인구 매개변수 , 즉 전체 인구의 특정 특성을 설명하는 숫자를 측정하는 데 관심이 있습니다. 가장 일반적인 인구 매개변수 중 두 가지는 다음과 같습니다. 1. 인구평균: 인구 내 변수의 평균값(예: 특정 도시의 남성 평균 키) 2. 인구 비율: 인구...
상자 그림은 다음을 포함하는 데이터 세트의 5자리 요약을 표시하는 그림 유형입니다. 최소값 첫 번째 사분위수(25번째 백분위수) 중앙값 3분위수(75번째 백분위수) 최대값 상자 그림을 만들기 위해 첫 번째 사분위수부터 세 번째 사분위수까지 상자를 그립니다. 다음으로 중앙값에 수직선을 그립니다. 마지막으로 사분위수의 “수염”을 최소값과 최대값까지...