통계에서는 두 그룹의 평균 사이에 통계적으로 유의미한 차이가 있는지 확인하기 위해 p-값을 자주 사용합니다. 그러나 p-값은 두 그룹 간에 통계적으로 유의미한 차이가 있는지 여부를 알려줄 수 있지만 효과 크기는 그 차이가 실제로 얼마나 큰지 알려줄 수 있습니다. 효과 크기의 가장 일반적인...
R의 lubridate 패키지에 있는 Floor_date() 함수를 사용하면 데이터를 월별로 빠르게 그룹화할 수 있습니다. 이 함수는 다음 기본 구문을 사용합니다. library (tidyverse) df %>% group_by(month = lubridate::floor_date(date_column, ' month ')) %>% summarize(sum = sum(value_column)) 다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다....
R에서 발생할 수 있는 오류는 다음과 같습니다. Error: ggplot2 doesn't know how to deal with data of class uneval 이 오류는 일반적으로 ggplot2를 사용하여 두 개의 데이터 프레임을 한 번에 플롯하려고 하지만 geom_line() 함수에서 데이터 인수를 사용할 수 없을 때 발생합니다....
다음 방법을 사용하여 R의 평균값으로 상자 그림을 그릴 수 있습니다. 방법 1: 기본 R 사용 #create boxplots boxplot(df$values~df$group) #calculate mean value by group means <- tapply(df$values, df$group, mean) #add means as circles to each boxplot points(means, pch= 20 ) 방법 2:...
사건 B가 발생한 경우 사건 A 가 발생할 조건부 확률은 다음과 같이 계산됩니다. P(A|B) = P(A∩B) / P(B) 금: P(A∩B) = 사건 A 와 사건 B 가 모두 발생할 확률입니다. P(B) = 사건 B가 발생할 확률. 조건부 확률은 일기예보, 스포츠 베팅,...
통계에서 단계적 선택은 입력할 통계적으로 유효한 이유가 더 이상 없을 때까지 모델에 단계별 방식으로 예측 변수를 입력하고 제거하여 일련의 예측 변수에서 회귀 모델을 구성하는 데 사용할 수 있는 절차입니다. 아니면 더 삭제하세요. 단계적 선택의 목표는 반응 변수와 통계적으로 유의하게 관련된 모든...
통계에서 단계적 선택은 입력할 통계적으로 유효한 이유가 더 이상 없을 때까지 모델에 단계별 방식으로 예측 변수를 입력하고 제거하여 일련의 예측 변수에서 회귀 모델을 구성하는 데 사용할 수 있는 절차입니다. 아니면 더 삭제하세요. 단계적 선택의 목표는 반응 변수와 통계적으로 유의하게 관련된 모든...
통계에서 오차 한계는 모집단 비율 또는 모집단 평균 추정치의 정확성을 평가하는 데 사용됩니다. 모집단 매개변수 에 대한 신뢰구간을 계산할 때 일반적으로 오차 한계를 사용합니다. 다음 예에서는 모집단 비율과 모집단 평균의 오차 한계를 계산하고 해석하는 방법을 보여줍니다. 예 1: 모집단 비율에 대한...
이탈리아 통계학자인 Corrado Gini 의 이름을 딴 지니 계수는 인구의 소득 분포를 측정하는 방법입니다. 지니 계수의 값 범위는 0에서 1까지이며, 값이 높을수록 소득 불평등이 커짐을 나타냅니다. 0은 완전한 소득 평등(모든 사람이 동일한 소득을 가짐)을 나타냅니다. 1은 완전 소득 불평등을 나타냅니다(한 개인이...
미국 경제학자 맥스 로렌츠(Max Lorenz) 의 이름을 딴 로렌츠 곡선은 인구의 소득 분포를 시각화하는 방법입니다. 이 튜토리얼에서는 Excel에서 다음 로렌츠 곡선을 만드는 방법에 대한 단계별 예를 제공합니다. 갑시다! 1단계: 데이터 입력 먼저 특정 국가의 누적 인구와 개인의 누적 소득이라는 두 열에...