기하 분포는 일련의 베르누이 시행에서 첫 번째 성공을 경험하기 전에 특정 수의 실패를 경험할 확률을 모델링하는 데 사용되는 확률 분포입니다. 베르누이 시행은 ‘성공’ 또는 ‘실패’라는 두 가지 결과만 가능한 실험이며, 실험을 수행할 때마다 성공할 확률은 동일합니다. 베르누이 에세이의 예는 동전 던지기입니다....
일원 분산 분석은 3개 이상의 독립 그룹 평균 간에 통계적으로 유의한 차이가 있는지 여부를 확인하는 데 사용됩니다. ANOVA에 사용된 가정은 다음과 같습니다. H 0 : 각 그룹의 평균이 동일합니다. H A : 적어도 한 가지 방법은 다른 방법과 다릅니다. ANOVA의 p-값이...
Welch의 분산 분석은 등분산 가정이 충족되지 않는 경우 일반적인 일원 분산 분석에 대한 대안입니다. 다음 단계별 예에서는 R에서 Welch의 ANOVA를 수행하는 방법을 보여줍니다. 1단계: 데이터 생성 세 가지 학습 방법이 서로 다른 시험 결과를 가져오는지 확인하기 위해 교수는 무작위로 10명의 학생에게...
Welch의 분산 분석은 등분산 가정이 충족되지 않는 경우 일반적인 일원 분산 분석에 대한 대안입니다. 다음 단계별 예에서는 Python에서 Welch의 ANOVA를 수행하는 방법을 보여줍니다. 1단계: 데이터 생성 세 가지 학습 방법이 서로 다른 시험 결과를 가져오는지 확인하기 위해 교수는 무작위로 10명의 학생에게...
R의 데이터 프레임에 있는 여러 변수에 대한 빈도 테이블을 계산하려면 다음 구문을 사용하는 apply() 함수를 사용할 수 있습니다. 적용 (X, FUN 마진) 금: X: 배열, 행렬 또는 데이터 블록 MARGIN: 행(1) 또는 열(2)에 함수를 적용합니다. FUN : 적용하는 기능 다음 예에서는...
통계에서 분위수는 분류된 데이터 세트를 동일한 그룹으로 나누는 값입니다. R에서 특정 변수로 그룹화된 분위수를 계산하려면 R의 dplyr 패키지에서 다음 함수를 사용할 수 있습니다. library (dplyr) #define quantiles of interest q = c(.25, .5, .75) #calculate quantiles by grouping variable df %>%...
상대도수표는 데이터세트의 전체 값 수에 비해 데이터세트의 특정 값이 얼마나 자주 나타나는지 알려줍니다. 다음 기본 구문을 사용하여 R에서 빈도 테이블을 만들 수 있습니다. table(data)/length(data) table() 함수는 각 개별 데이터 값의 빈도를 계산하고 length() 함수는 데이터 세트에 있는 값의 총 개수를 계산합니다....
통계에서 5분위수는 데이터 세트를 동일한 빈도의 5개 그룹으로 나누는 숫자입니다. 1분위수는 전체 데이터 값의 20%가 아래로 떨어지는 지점이다. 두 번째 5분위수는 전체 데이터 값의 40%가 아래로 떨어지는 지점 등입니다. 다음 함수를 사용하여 Excel에서 데이터 세트의 5분위수를 계산할 수 있습니다. =PERCENTILE( CELL...
통계에서 평균절대오차 (MAE)는 주어진 모델의 정확도를 측정하는 방법입니다. 다음과 같이 계산됩니다. MAE = (1/n) * Σ|y i – x i | 금: Σ: “합계”를 의미하는 그리스 기호 y i : i 번째 관측치에 대한 관측값 x i : i번째 관측치에 대한...
통계에서 평균절대오차 (MAE)는 주어진 모델의 정확도를 측정하는 방법입니다. 다음과 같이 계산됩니다. MAE = (1/n) * Σ|y i – x i | 금: Σ: “합계”를 의미하는 그리스 기호 y i : i 번째 관측치에 대한 관측값 x i : i번째 관측치에 대한...