통계에서는 응답 변수의 값이 데이터 세트의 나머지 관측치보다 훨씬 큰 경우 관측치 를 이상 값으로 간주합니다. 마찬가지로, 데이터 세트의 나머지 관측치에 비해 훨씬 더 극단적인 예측 변수에 대한 값이 하나 이상 있으면 관측치가 높은 레버리지 로 간주됩니다. 모든 유형의 분석에서 첫...
통계에서 우리는 회귀 모델에서 다양한 관찰이 어떤 영향을 미치는지 알고 싶어하는 경우가 많습니다. 관측치의 영향을 계산하는 한 가지 방법은 “적합의 차이”를 의미하는 DFFITS 라는 측정항목을 사용하는 것입니다. 이 측정항목은 개별 관찰을 생략할 때 회귀 모델에 의한 예측이 얼마나 변경되는지 알려줍니다. 이...
통계에서 우리는 회귀 모델에서 다양한 관찰이 어떤 영향을 미치는지 알고 싶어하는 경우가 많습니다. 관측값의 영향을 계산하는 한 가지 방법은 DFBETAS 라는 측정항목을 사용하는 것입니다. 이는 각 개별 관측값을 제거하는 각 계수에 대한 표준화된 효과를 알려줍니다. 이 측정항목은 주어진 회귀 모델의 각...
Goldfeld-Quandt 테스트는 회귀 모델에 이분산성이 존재하는지 여부를 확인하는 데 사용됩니다. 이분산성은 회귀 모델에서 반응 변수 의 다양한 수준에서 잔차 가 고르지 않게 분산되는 것을 의미합니다. 이분산성이 존재하는 경우 이는 잔차가 반응 변수의 각 수준에 동일하게 분산되어 있다는 선형 회귀 분석의 주요...
row.names() 함수를 사용하면 R에서 데이터 프레임의 행 이름을 빠르게 가져오고 설정할 수 있습니다. 이 튜토리얼에서는 R에 내장된 mtcars 데이터세트에서 이 함수를 실제로 사용하는 몇 가지 예를 제공합니다. #view first six rows of mtcars head(mtcars) mpg cyl disp hp drat wt qsec...
평균은 데이터 집합의 평균 값을 나타냅니다. 이는 데이터 세트의 중심이 어디에 있는지에 대한 좋은 아이디어를 제공합니다. 표준 편차는 데이터 세트의 값 분포를 나타냅니다. 이를 통해 관측치가 평균을 중심으로 얼마나 밀접하게 밀집되어 있는지 알 수 있습니다. 이 두 값만 사용하면 데이터 세트의...
Excel에서 표준 편차를 계산하는 데 사용할 수 있는 세 가지 기능이 있습니다. 1. STDEV.P: 이 함수는 모집단 표준편차를 계산합니다. 값의 범위가 전체 모집단을 나타내는 경우 이 함수를 사용하세요. 이 함수는 다음 공식을 사용합니다. 모집단 표준편차 = √Σ (x i – μ)...
Google 스프레드시트에서 특정 유효 숫자 수로 값을 반올림하려는 경우가 종종 있습니다. 이를 수행하려면 다음 수식을 사용할 수 있습니다. = ROUND (value,figures-(1+ INT ( LOG10 ( ABS (value))))) 여기서 value 는 반올림할 값이고 digits는 반올림할 유효 자릿수입니다. 공식의 기능을 요약하면 다음과 같습니다....
중앙값 절대 편차는 데이터 세트의 관측치 분포를 측정합니다. 이는 표준 편차 및 분산과 같은 다른 분산 측정값보다 이상치의 영향을 덜 받기 때문에 특히 유용한 측정값입니다. 절대 중앙값 편차(종종 MAD로 약칭)를 계산하는 공식은 다음과 같습니다. MAD = 중앙값(|x i – x m...
중앙값 절대 편차는 데이터 세트의 관측치 분포를 측정합니다. 이는 표준 편차 및 분산과 같은 다른 분산 측정값보다 이상치의 영향을 덜 받기 때문에 특히 유용한 측정값입니다. 절대 중앙값 편차(종종 MAD로 약칭)를 계산하는 공식은 다음과 같습니다. MAD = 중앙값(|x i – x m...