상자 그림은 다음을 포함하는 데이터 세트의 5자리 요약을 표시하는 그림 유형입니다. 최소값 첫 번째 사분위수(25번째 백분위수) 중앙값 3분위수(75번째 백분위수) 최대값 상자 그림을 만들려면 먼저 1분위수부터 3분위수까지 상자를 그립니다. 다음으로 중앙값에 수직선을 그립니다. 마지막으로 사분위수의 “수염”을 최소값과 최대값까지 그립니다. 대부분의 통계 소프트웨어에서...
통계에서 다차원 스케일링은 추상 데카르트 공간(보통 2D 공간)의 데이터 세트에서 관측치의 유사성을 시각화하는 방법입니다. R에서 다차원 스케일링을 수행하는 가장 쉬운 방법은 다음 기본 구문을 사용하는 내장 cmdscale() 함수를 사용하는 것입니다. cmdscale(d, eig = FALSE, k = 2, …) 금: d :...
다음 방법 중 하나를 사용하여 R의 데이터 프레임에 있는 단일 열의 이름을 바꿀 수 있습니다. 방법 1: Base R을 사용하여 단일 열 이름 바꾸기 #rename column by name colnames(df)[colnames(df) == ' old_name '] <- ' new_name ' #rename column by position...
통계에서 승산비는 처리 그룹에서 사건이 발생할 확률과 대조 그룹에서 사건이 발생할 확률의 비율을 나타냅니다. 2×2 테이블에서 분석을 수행할 때 승산비를 계산하는 경우가 많으며 다음 형식을 사용합니다. R에서 승산비를 계산하려면 Epitools 패키지의 승산비() 함수를 사용할 수 있습니다. 다음 예에서는 실제로 이 구문을...
ggplot2의 scale_y_continuous() 함수를 사용하여 주어진 플롯의 y축을 사용자 정의할 수 있습니다. 이 함수는 다음 기본 구문을 사용합니다. p+ scale_y_continuous(breaks, n.breaks, labels, limits, ...) 금: break : y축 브레이크 위치의 숫자형 벡터 n.breaks : y축의 총 나누기 수를 지정하는 정수 벡터 labels...
ggplot2의 scale_x_continuous() 함수를 사용하여 주어진 플롯의 x축을 사용자 정의할 수 있습니다. 이 함수는 다음 기본 구문을 사용합니다. p+ scale_x_continuous(breaks, n.breaks, labels, limits, ...) 금: break : x축의 브레이크 위치에 대한 숫자 벡터입니다. n.breaks : x축의 총 나누기 수를 지정하는 정수 벡터...
다음 방법을 사용하여 dplyr 의 데이터 프레임 값의 표준 편차를 계산할 수 있습니다. 방법 1: 변수의 표준편차 계산 library (dplyr) df %>% summarise(sd_var1 = sd(var1, na. rm = TRUE )) 방법 2: 여러 변수의 표준편차 계산 library (dplyr) df %>% summarize(sd_var1...
다음 방법을 사용하여 R의 두 열 값 간의 비율을 계산할 수 있습니다. 방법 1: 기본 R 사용 #calculate ratio between variable1 and variable2 df$ratio <- df$variable1/df$variable1 #calculate ratio between variable1 and variable2, rounded to 2 decimal places df$ratio <- round(df$variable1/df$variable2, 2...
분산 비율 테스트는 두 모집단 분산이 같은지 여부를 테스트하는 데 사용됩니다. 이 테스트에서는 다음과 같은 귀무가설과 대립가설을 사용합니다. H 0 : 모집단 분산이 동일함 H A : 모집단 분산이 동일하지 않습니다. 이 테스트를 수행하기 위해 다음 테스트 통계를 계산합니다. F =...