White의 테스트는 회귀 모델에 이분산성이 존재하는지 여부를 확인하는 데 사용됩니다. 이분산성은 회귀 모델에서 반응 변수 의 다양한 수준에서 잔차가 고르지 않게 분산되는 것을 의미하며, 이는 잔차가 반응 변수의 각 수준에서 동일하게 분산된다는 선형 회귀의 주요 가정 중 하나를 위반합니다. 이 튜토리얼에서는...
많은 통계 테스트에서는 특정 변수의 값이 정규 분포를 따른다고 가정합니다. 그러나 값이 정규 분포를 따르지 않는 경우가 많습니다 . 이 문제를 해결하는 한 가지 방법은 각 값의 로그를 취하여 변수를 변환하는 것입니다. 이 변환을 수행하면 변수는 일반적으로 정규 분포에 가까워집니다. 다음...
회귀 분석에서 다중 공선성은 두 개 이상의 예측 변수가 서로 높은 상관 관계를 갖고 있어 회귀 모델에서 고유하거나 독립적인 정보를 제공하지 않는 경우에 발생합니다. 변수 간의 상관 정도가 충분히 높으면 회귀 모델을 피팅하고 해석할 때 문제가 발생할 수 있습니다. 다중 공선성을...
PROC IMPORT 문을 사용하면 텍스트 파일의 데이터를 SAS로 빠르게 가져올 수 있습니다. 이 절차에서는 다음 기본 구문을 사용합니다. /*import data from text file called data.txt*/ proc import out =my_data datafile ="/home/u13181/data.txt" dbms =dlm replace ; getnames =YES; run ; 각 줄의...
PROC EXPORT 문을 사용하여 SAS의 데이터를 텍스트 파일로 빠르게 내보낼 수 있습니다. 이 절차에서는 다음 기본 구문을 사용합니다. /*export data to file called my_data.txt*/ proc export data =my_data outfile ="/home/u13181/my_data.txt" dbms =tab replace ; run ; 각 줄의 역할은 다음과 같습니다....
RANGE 옵션과 함께 PROC IMPORT 문을 사용하여 Excel 파일의 특정 셀 범위를 SAS로 가져올 수 있습니다. 이를 위해 다음 기본 구문을 사용할 수 있습니다. /*import data from Excel file called basketball_data.xlsx*/ proc import out =my_data datafile ="/home/u13181/basketball_data.xlsx" dbms =xlsx replace ;...
상관행렬은 데이터 세트에 포함된 변수 간의 상관계수를 보여주는 정사각형 테이블입니다. 이는 데이터 세트의 변수 간에 존재하는 선형 관계의 강도를 빠르게 이해할 수 있는 방법을 제공합니다. SAS에서 PROC CORR 문을 사용하여 특정 데이터 세트에 대한 상관 행렬을 생성할 수 있습니다. /*create correlation...
“분위수-분위수”의 약자인 QQ 플롯은 데이터 세트가 잠재적으로 이론적 분포에서 나오는지 여부를 평가하는 데 사용됩니다. 대부분의 경우 이러한 유형의 도표는 데이터 세트가 정규 분포를 따르는지 여부를 확인하는 데 사용됩니다. 데이터가 정규 분포를 따르는 경우 QQ 플롯의 점은 직선 대각선에 놓이게 됩니다. 반대로,...