다음 방법을 사용하여 R에서 데이터 프레임의 열 이름을 가져올 수 있습니다. 방법 1: 모든 열 이름 가져오기 colnames(df) 방법 2: 열 이름을 알파벳순으로 가져오기 sort(colnames(df)) 방법 3: 특정 데이터 유형의 열 이름 가져오기 colnames(df[,sapply(df, is.numeric )]) 다음 예에서는 R의 다음 데이터...
종종 ggplot2에서 그룹별 평균 및 표준 편차를 표시하고 싶을 수도 있습니다. 다행히도 ggplot2의 geom_point() 및 geom_errorbar() 함수를 사용하면 이 작업을 쉽게 수행할 수 있습니다. 다음 예에서는 이러한 함수를 사용하여 다양한 농구 팀이 득점한 점수의 평균 및 표준 편차를 보여주는 다음 그래프를...
다음 방법 중 하나를 사용하여 R에서 그룹별 표준 편차를 계산할 수 있습니다. 방법 1: R 베이스 사용 aggregate(df$col_to_aggregate, list(df$col_to_group_by), FUN=sd) 방법 2: dplyr 사용 library (dplyr) df %>% group_by(col_to_group_by) %>% summarise_at(vars(col_to_aggregate), list(name=sd)) 방법 3: data.table 사용 library (data.table) setDT(df) dt[ ,list(sd=sd(col_to_aggregate)),...
회귀 분석에서 다중 공선성은 두 개 이상의 예측 변수가 서로 높은 상관 관계를 갖고 있어 회귀 모델에서 고유하거나 독립적인 정보를 제공하지 않는 경우에 발생합니다. 예측 변수 간의 상관 정도가 충분히 높으면 회귀 모델을 피팅하고 해석할 때 문제가 발생할 수 있습니다. 회귀...
dplyr 패키지를 사용하여 R의 데이터 프레임에서 여러 열을 제거하려면 다음 방법 중 하나를 사용할 수 있습니다. 1. 이름으로 여러 열 제거 df_new <- df %>% select(-c(col2, col4)) 2. 범위에서 모든 열을 제거합니다. df_new <- df %>% select(-c(col2:col4)) 다음 예에서는 다음 데이터...
다음 기본 구문을 사용하여 ggplot2에서 여러 줄을 그릴 수 있습니다. ggplot(df, aes(x=x_var, y=y_var)) + geom_line(aes(color=group_var)) + scale_color_manual(name=' legend_title ', labels=c(' lab1 ', ' lab2 ', ' lab3 '), values=c(' color1 ', ' color2 ', ' color3 ')) 이 특정 구문은 ggplot2에...
다음 기본 구문을 사용하여 ggplot2의 수평선에 레이블을 추가할 수 있습니다. + annotate(" text ", x= 9 , y= 20 , label=" Here is my text ") 다음 예에서는 이 구문을 실제로 사용하는 방법을 보여줍니다. 예시 1: geom_hline에 라벨 추가 다음 코드는...
“분위수-분위수”의 약자인 QQ 플롯은 데이터 세트가 잠재적으로 이론적 분포에서 나오는지 여부를 평가하는 데 사용됩니다. 대부분의 경우 이러한 유형의 도표는 데이터 세트가 정규 분포를 따르는지 여부를 확인하는 데 사용됩니다. 데이터가 정규 분포를 따르는 경우 QQ 플롯의 점은 직선 대각선에 놓이게 됩니다. 반대로,...
잔차 도표는 회귀 모델의 잔차가 정규 분포를 따르는지 여부와 이분산성을 나타내는지 여부를 평가하는 데 사용됩니다. ggplot2에서 잔차 플롯을 생성하려면 다음 기본 구문을 사용할 수 있습니다. library (ggplot2) ggplot(model, aes(x = .fitted, y = .resid)) + geom_point() + geom_hline(yintercept = 0 )...
다음 기본 구문을 사용하여 ggplot2의 플롯에서 점과 선을 연결할 수 있습니다. library (ggplot2) ggplot(df, aes(x=x_var, y=y_var)) + geom_line() + geom_point() 다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다. 예: ggplot2에서 점을 선과 연결 연속 10일 동안 매장에서 이루어진 판매 건수를 포함하는...