통계에서 왜도와 첨도는 분포의 모양을 측정하는 두 가지 방법입니다. 왜도는 분포의 왜도를 측정한 것입니다. 이 값은 양수 또는 음수일 수 있습니다. 음의 왜도는 꼬리가 분포의 왼쪽에 있고 더 음의 값 쪽으로 확장된다는 것을 나타냅니다. 양의 치우침은 꼬리가 분포의 오른쪽에 있고 더...
사분위수는 데이터 세트를 4개의 동일한 부분으로 나누는 값입니다. 첫 번째 사분위수는 데이터 세트의 25번째 백분위수를 나타냅니다. 두 번째 사분위수는 데이터 세트의 50번째 백분위수를 나타냅니다. 이 값은 데이터 세트의 중앙값 과 동일합니다. 세 번째 사분위수는 데이터 세트의 75번째 백분위수를 나타냅니다. Quantile() 함수를...
기계 학습 분야에는 데이터를 이해하는 데 사용할 수 있는 방대한 알고리즘 세트가 포함되어 있습니다. 이러한 알고리즘은 다음 두 가지 범주 중 하나로 분류될 수 있습니다. 1. 지도 학습 알고리즘: 하나 이상의 입력을 기반으로 결과를 추정하거나 예측하는 모델을 구축하는 작업이 포함됩니다. 2....
다음 구문을 사용하는 numpy.random.normal() 함수를 사용하면 Python에서 정규 분포를 빠르게 생성할 수 있습니다. numpy. random . normal (loc=0.0, scale=1.0, size=None) 금: loc: 분포의 평균입니다. 기본값은 0입니다. 규모: 분포의 표준 편차. 기본값은 1입니다. 크기: 샘플 크기. 이 튜토리얼에서는 이 함수를 사용하여 Python에서...
기계 학습 알고리즘은 지도 학습 알고리즘과 비지도 학습 알고리즘이라는 두 가지 유형으로 나눌 수 있습니다. 지도 학습 알고리즘은 두 가지 유형으로 분류될 수 있습니다. 1. 회귀: 반응 변수는 연속형입니다. 예를 들어 응답 변수는 다음과 같을 수 있습니다. 무게 키 가격 시간...
데이터 세트에 대한 모델의 성능을 평가하려면 모델의 예측이 관찰된 데이터와 얼마나 잘 일치하는지 측정해야 합니다. 회귀 모델 의 경우 가장 일반적으로 사용되는 측정항목은 평균 제곱 오차(MSE)이며 다음과 같이 계산됩니다. MSE = (1/n)*Σ(y i – f( xi )) 2 금: n: 총...
단일 예측변수와 반응변수 사이의 관계를 이해하고자 할 때 우리는 종종 단순선형회귀분석을 사용합니다. 그러나 여러 예측 변수와 응답 변수 간의 관계를 이해하려면 다중 선형 회귀를 사용할 수 있습니다. p개의 예측 변수가 있는 경우 다중 선형 회귀 모델은 다음과 같은 형식을 취합니다. Y...
하나 이상의 예측 변수와 연속형 응답 변수 간의 관계를 이해하려는 경우 선형 회귀 분석을 사용하는 경우가 많습니다. 그러나 응답 변수가 범주형인 경우 로지스틱 회귀를 사용할 수 있습니다. 로지스틱 회귀는 데이터 세트의 관측치를 고유한 범주로 “분류”하려고 시도하기 때문에 일종의 분류 알고리즘 입니다....