다음 방법을 사용하여 R의 데이터 프레임에서 단일 행을 선택할 수 있습니다. 방법 1: 모든 열에서 단일 행 선택 library (dplyr) df %>% distinct() 방법 2: 열을 기준으로 단일 행 선택 library (dplyr) df %>% distinct(column1, . keep_all = TRUE ) 방법...
R의 dplyr 패키지에 있는 coalesce() 함수를 사용하여 하나 이상의 벡터의 각 위치에서 누락되지 않은 첫 번째 값을 반환할 수 있습니다. 이 기능을 사용하는 두 가지 일반적인 방법이 있습니다. 방법 1: 벡터의 누락된 값 대체 library (dplyr) #replace missing values with 100...
Case 문은 조건을 순환하고 첫 번째 조건이 충족되면 값을 반환하는 문 유형입니다. R에서 Case 문을 구현하는 가장 쉬운 방법은 dplyr 패키지의 case_when() 함수를 사용하는 것입니다. library (dplyr) df %>% mutate(new_column = case_when( col1 < 9 ~ ' value1 ', col1 <...
dplyr을 사용하여 데이터 프레임에서 중복 요소를 찾으려면 다음 방법을 사용할 수 있습니다. 방법 1: 모든 중복 행 표시 library (dplyr) #display all duplicate rows df %>% group_by_all() %>% filter(n()> 1 ) %>% A group() 방법 2: 모든 중복 행에 대한 중복...
다음 방법을 사용하여 Inf 값을 R의 NA 값으로 바꿀 수 있습니다. 방법 1: Inf를 벡터의 NA로 대체 x[is. infinite (x)] <- NA 방법 2: 데이터 프레임의 모든 열에서 Inf를 NA로 교체 df[sapply(df, is. infinite )] <- NA 방법 3: 데이터 프레임의...
다음 방법을 사용하여 dplyr에서 그룹별로 행을 구성할 수 있습니다. 방법 1: 그룹별로 오름차순으로 행 정렬 library (dplyr) #arrange rows in ascending order based on col2, grouped by col1 df %>% group_by(col1) %>% arrange(col2, . by_group = TRUE ) 방법 2: 그룹별로...
다음 방법을 사용하여 특정 조건으로 R의 데이터 프레임 열에 있는 값의 개수를 계산할 수 있습니다. 방법 1: 조건이 있는 열의 값 계산 nrow(df[df$column1 == ' value1 ', ]) 방법 2: 조건이 있는 여러 열의 값 계산 nrow(df[df$column1 == ' value1 '...
시계열 분석에서 이동 평균은 여러 이전 기간의 평균 값을 나타냅니다. R에서 이동 평균을 계산하는 가장 쉬운 방법은 Zoo 패키지의 Rollmean() 함수를 사용하는 것입니다. library (dplyr) library (zoo) #calculate 3-day rolling average df %>% mutate(rolling_avg = rollmean(values, k= 3 , fill=NA, align='...
다음 기본 구문을 사용하여 R에서 그룹화 및 계산 조건을 수행할 수 있습니다. library (dplyr) df %>% group_by(var1) %>% summarize(count = sum(var2 == ' val ')) 이 특정 구문은 var1을 기준으로 데이터 프레임의 줄을 그룹화한 다음 var2가 “val”과 같은 줄 수를 계산합니다....
다음 사용자 정의 함수를 사용하여 R의 데이터 프레임에 하나 이상의 열이 아직 없는 경우 추가할 수 있습니다. add_cols <- function (df, cols) { add <- cols[!cols %in% names(df)] if (length(add) != 0) df[add] <- NA return (df) } 다음 예에서는 실제로...