다음 기본 구문을 사용하여 ggplot2를 사용하여 그래프에 두 개의 선을 그릴 수 있습니다. ggplot(df, aes (x = x_variable)) + geom_line( aes (y=line1, color=' line1 ')) + geom_line( aes (y=line2, color=' line2 ')) 다음 예에서는 이 구문을 실제로 사용하는 방법을 보여줍니다. 예...
데이터 세트의 모드는 가장 빈번한 값을 나타냅니다. 주어진 데이터 세트에는 모드가 없거나 단일 모드 또는 다중 모드가 있을 수 없습니다. R 통계 소프트웨어에는 데이터 세트의 모드를 계산하는 내장 기능이 없지만 다음 기능을 사용하여 모드를 계산할 수 있습니다. find_mode <- function (x)...
R에서 히스토그램을 만들 때 Sturges의 규칙 이라는 공식을 사용하여 사용할 최적의 그룹 수를 결정합니다. 그러나 다음 구문을 사용하여 이 수식을 재정의하고 히스토그램에 사용할 정확한 그룹 수를 지정할 수 있습니다. hist(data, breaks = seq(min(data), max(data), length. out = 7 )) 히스토그램에 사용되는...
다음 기본 구문을 사용하여 ggplot2에서 히스토그램의 y축에 백분율을 표시할 수 있습니다. library (ggplot2) library (scales) #create histogram with percentages ggplot(data, aes (x = factor (team))) + geom_bar( aes (y = (..count..)/ sum (..count..))) + scale_y_continuous(labels=percent) 다음 예에서는 이 구문을 실제로 사용하는...
R에서 발생할 수 있는 오류는 다음과 같습니다. Error in apply(df$var1, 2, mean): dim(X) must have a positive length 이 오류는 데이터 프레임이나 행렬 대신 벡터를 인수로 제공하면서 데이터 프레임이나 행렬의 열에 대한 메트릭을 계산하기 위해 apply() 함수를 사용하려고 할 때 발생합니다....
점 추정치는 모집단 모수를 추정하기 위해 표본 데이터에서 계산하는 숫자를 나타냅니다. 이는 실제 인구 매개변수가 무엇인지에 대한 최선의 추정치입니다. 다음 표는 모집단 모수를 추정하는 데 사용하는 점 추정을 보여줍니다. 측정값 인구 매개변수 포인트 추정 평균 μ(인구 평균) x (샘플 평균) 비율...
R에서 발생할 수 있는 오류는 다음과 같습니다. Error in df$var1- df$var2: non-numeric argument to binary operator 이 오류는 두 벡터에 대해 이진 연산을 수행하려고 할 때 벡터 중 하나가 숫자가 아닐 때 발생합니다. 다음은 이진 연산의 예입니다. 빼기 ( – )...
확률 분포는 임의 변수가 특정 값을 취할 확률을 알려줍니다. 예를 들어, 다음 확률 분포는 특정 축구팀이 특정 경기에서 특정 수의 골을 득점할 확률을 알려줍니다. 확률 분포의 기대값을 찾으려면 다음 공식을 사용할 수 있습니다. µ = Σx * P(x) 금: x: 데이터...
확률 분포는 임의 변수가 특정 값을 취할 확률을 알려줍니다. 예를 들어, 다음 확률 분포는 특정 축구팀이 특정 경기에서 특정 수의 골을 넣을 확률을 알려줍니다. 확률 분포의 기대값을 찾으려면 다음 공식을 사용할 수 있습니다. µ = Σx * P(x) 금: x: 데이터...
R에서 데이터 프레임을 전치하는 데 사용할 수 있는 두 가지 일반적인 방법이 있습니다. 방법 1: 기본 R 사용 #transpose data frame t(df) 방법 2: data.table 사용 library (data.table) #transpose data frame df_t <- transpose(df) #redefine row and column names rownames(df_t) <-...