R을 사용할 때 발생할 수 있는 오류는 다음과 같습니다. Error in plot.window(...): need finite 'xlim' values 이 오류는 R에서 플롯을 만들고 x축에 문자형 벡터나 NA 값만 있는 벡터를 사용하려고 할 때 발생합니다. 다음 예에서는 이 오류가 실제로 발생할 수 있는 두...
R에서 접할 수 있는 일반적인 경고는 다음과 같습니다. glm.fit: algorithm did not converge 이 경고는 R에 로지스틱 회귀 모델을 적용하고 완벽한 분리를 확인하려고 할 때 자주 발생합니다. 즉, 예측 변수가 응답 변수를 0과 1로 완벽하게 분리할 수 있습니다. 다음 예에서는 실제로...
R에서 접할 수 있는 일반적인 경고는 다음과 같습니다. Warning message: In predict.lm(model, df): prediction from a rank-deficient fit may be misleading 이 경고는 다음 두 가지 이유로 발생할 수 있습니다. 이유 1 : 두 예측 변수가 완벽하게 상관되어 있습니다. 이유 2...
통계에서 모든 변수는 다음 네 가지 측정 척도 중 하나로 측정됩니다. 명목형(Nominal) : 양적 가치를 가지지 않는 변수. 순서 형(Ordinal) : 자연적인 순서를 가지지만 값 사이에 수량화 가능한 차이가 없는 변수입니다. 간격 : 값 사이에 자연스러운 순서와 정량화 가능한 차이가 있지만...
통계에는 두 가지 유형의 변수가 있습니다. 정량변수 : 측정 가능한 양을 나타내는 변수. 예는 다음과 같습니다: 평방피트 키 무게 인구 규모 정성적 변수 : 이름이나 라벨을 취하고 범주에 속하는 변수. 예는 다음과 같습니다: 눈 색깔 성별 결혼 여부 개 품종 학생들이...
상자 그림은 다음을 포함하는 데이터 세트의 5자리 요약을 표시하는 그림 유형입니다. 최소값 첫 번째 사분위수(25번째 백분위수) 중앙값 3분위수(75번째 백분위수) 최대값 우리는 모든 데이터 세트에 대한 상자 그림을 만들기 위해 세 가지 간단한 단계를 사용합니다. 1. 1분위수부터 3분위수까지 상자를 그립니다. 2. 중앙값에...
회귀 모델은 하나 이상의 예측 변수와 반응 변수 간의 관계를 수량화하는 데 사용됩니다. 회귀 모델을 적합시킬 때마다 모델이 예측 변수의 값을 얼마나 잘 사용하여 응답 변수의 값을 예측할 수 있는지 이해하고 싶습니다. 모델이 데이터 세트에 얼마나 잘 맞는지 수량화하기 위해 자주...
선형 회귀는 예측 변수와 반응 변수 간의 관계를 수량화하는 데 사용됩니다. 선형 회귀를 수행할 때마다 예측 변수와 응답 변수 사이에 통계적으로 유의미한 관계가 있는지 알고 싶습니다. 회귀 기울기에 대해 t-테스트를 수행하여 유의성을 테스트합니다. 이 t-검정에는 다음과 같은 귀무 가설과 대립 가설을...
NumPy를 사용할 때 발생할 수 있는 오류는 다음과 같습니다. TypeError : 'numpy.float64' object cannot be interpreted as an integer 이 오류는 정수를 기대하는 함수에 부동 소수점을 제공할 때 발생합니다. 다음 예에서는 실제로 이 오류를 수정하는 방법을 보여줍니다. 오류를 재현하는 방법 NumPy...
Pandas 의 많은 함수에서는 특정 계산을 적용할 축을 지정해야 합니다. 일반적으로 다음과 같은 경험 법칙이 적용됩니다. axis=0 : “열당” 계산 적용 axis=1 : “라인당” 계산 적용 다음 예에서는 다음 Pandas DataFrame을 사용하여 다양한 시나리오에서 축 인수를 사용하는 방법을 보여줍니다. import pandas...