특정 회귀 모델에서 선형 가설을 테스트하려면 R의 car 패키지에 있는 LinearHypothesis() 함수를 사용할 수 있습니다. 이 함수는 다음 기본 구문을 사용합니다. linearHypothesis(fit, c(" var1=0 ", " var2=0 ")) 이 특정 예에서는 fit 이라는 모델의 회귀 계수 var1 과 var2가 함께 0인지...
R에서 reshape2 패키지의 Melt() 함수를 사용하여 데이터 프레임을 넓은 형식에서 긴 형식으로 변환할 수 있습니다. 와이드 형식에는 첫 번째 열에서 반복 되지 않는 값이 포함됩니다. 긴 형식에는 첫 번째 열에서 반복되는 값이 포함됩니다. 예를 들어, 서로 다른 형식으로 표현된 동일한 데이터를...
R에서 다음 방법을 사용하여 데이터 프레임에서 중복 행을 제거하여 결과 데이터 프레임에 아무 것도 남지 않도록 할 수 있습니다. 방법 1: 기본 R 사용 new_df <- df[ ! (duplicated(df) | duplicated(df, fromLast= TRUE )), ] 방법 2: dplyr 사용 library (dplyr)...
최소 제곱법은 주어진 데이터 집합에 가장 잘 맞는 회귀선을 찾는 데 사용할 수 있는 방법입니다. R에서 회귀선을 맞추기 위해 최소 제곱법을 사용하려면 lm() 함수를 사용할 수 있습니다. 이 함수는 다음 기본 구문을 사용합니다. model <- lm(response ~ predictor, data=df) 다음 예에서는...
dplyr if_else() 함수는 R 기본 ifelse() 함수에 비해 세 가지 장점이 있습니다. 1. if_else() 함수는 if else 문의 두 대안이 동일한 데이터 유형을 가지고 있는지 확인합니다. 2. if_else() 함수는 Date 객체를 숫자로 변환하지 않습니다. 3. if_else() 함수는 NA 값을 처리하는 방법을...
선형 회귀의 가정 중 하나는 모델 잔차가 예측 변수의 각 수준에 동일하게 분산되어 있다는 것입니다. 이 가정이 충족되지 않으면 회귀 모델에 이분산성이 존재한다고 합니다. 이런 일이 발생하면 모델 회귀 계수의 표준 오류가 신뢰할 수 없게 됩니다. 이를 설명하기 위해 우리는 이분산성에...
Cramer-Von Mises 검정은 표본이 정규 분포 에서 나오는지 여부를 확인하는 데 사용됩니다. 이 유형의 테스트는 주어진 데이터 세트가 회귀 , ANOVA , t-테스트 등을 포함한 많은 통계 테스트에서 일반적으로 사용되는 가정인 정규 분포에서 나오는지 여부를 결정하는 데 유용합니다. ‘다른 사람들. R의...
다음 방법 중 하나를 사용하여 문자열을 dplyr의 변수 이름으로 전달할 수 있습니다. 방법 1: get() 사용 df %>% filter(get(my_var) == ' A ') 방법 2: .data 사용 df %>% filter(. data [[my_var]] == ' A ') 다음 예에서는 다음 데이터 프레임을...
R의 bizdays 패키지 기능을 사용하여 R의 두 날짜 사이의 영업일 수를 빠르게 더하고 빼고 계산할 수 있습니다. 다음 예에서는 이러한 기능을 실제로 사용하는 방법을 보여줍니다. 예시 1: R에서 두 날짜 사이의 영업일 수 계산 R에서 두 날짜 사이의 영업일 수를 계산하려면...
신뢰구간은 일정 수준의 신뢰도를 갖는 모집단 매개변수가 포함될 가능성이 있는 값의 범위입니다. 이 튜토리얼에서는 R에서 다음 신뢰 구간을 계산하는 방법을 설명합니다. 1. 모집단 평균에 대한 신뢰 구간 2. 모집단 평균의 차이에 대한 신뢰구간 갑시다! 예 1: SAS의 모집단 평균에 대한 신뢰...