다음 방법을 사용하여 R의 데이터 프레임에서 그룹별로 텍스트를 축소할 수 있습니다. 방법 1: Base R을 사용하여 그룹별로 텍스트 줄이기 aggregate(text_var ~ group_var, data=df, FUN=paste, collapse='') 방법 2: dplyr을 사용하여 그룹별로 텍스트 줄이기 library (dplyr) df %>% group_by(group_var) %>% summarize(text=paste(text_var, collapse='')) 방법...
다음 방법을 사용하여 R의 문자열에서 숫자를 추출할 수 있습니다. 방법 1: 기본 R을 사용하여 문자열 번호 추출 as. numeric (gsub(" \\D ", "", df$my_column)) 방법 2: readerr 패키지를 사용하여 문자열 번호 추출 library (readr) parse_number(df$my_column) 이 튜토리얼에서는 다음 데이터 프레임을 사용하여...
다음 방법을 사용하여 R의 여러 조건을 기반으로 데이터 프레임을 하위 정의할 수 있습니다. 방법 1: “OR” 논리를 사용하는 하위 집합 데이터 프레임 df_sub <- subset(df, team == ' A ' | points < 20 ) 이 특정 예에서는 팀 열이 “A”...
다음 기본 구문을 사용하여 R의 요인 변수에 새 수준을 추가할 수 있습니다. levels(df$my_factor) <- c(levels(df$my_factor), ' new_level ') 다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다. 예: R의 요인에 새 수준 추가 소매점의 여러 지역에서 발생한 판매량을 표시하는 다음과 같은 데이터...
SAS에서 다음 매크로를 사용하여 데이터 세트가 존재하는지 빠르게 확인할 수 있습니다. %macro check_exists(data); %if %sysfunc ( exist (&data.)) %then %do ; %put Dataset Exists; %end ; %else %do ; %put Dataset Does Not Exist; %end ; %mend check_exists; 이 매크로를 실행하면...
다음 기본 구문을 사용하여 SAS에서 데이터 세트의 사분위수를 계산할 수 있습니다. /*calculate quartile values for variable called var1*/ proc univariate data =original_data; var var1; output out =quartile_data pctlpts = 25 50 75 pctlpre = Q_; run ; 참고 : pctlpts 명령어는...
통계에서 십분위수는 데이터 세트를 동일한 빈도의 10개 그룹으로 나누는 숫자입니다. 첫 번째 십분위수는 전체 데이터 값의 10%가 아래로 떨어지는 지점이다. 두 번째 십분위수는 전체 데이터 값의 20%가 아래로 떨어지는 지점 등입니다. 다음 기본 구문을 사용하여 SAS에서 데이터세트의 십분위수를 계산할 수 있습니다....
다음 기본 구문을 사용하여 SAS의 set 문에 여러 데이터 세트를 포함할 수 있습니다. data new_data; set data1 data2 data3; run ; 다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다. 예: SAS에서 여러 데이터세트에 SET 문 사용 A라는 팀의 다양한 농구 선수들이...
다음 구문을 사용하여 Pandas DataFrame의 날짜 열을 YYYYMMDD 형식으로 변환할 수 있습니다. #convert date column to datetime df[' date_column '] = pd. to_datetime (df[' date_column ']) #convert date to YYYYMMDD format df[' date_column '] = df[' date_column ']. dt . strftime...
다음 방법을 사용하여 Pandas DataFrame의 여러 조건에 따라 행을 삭제할 수 있습니다. 방법 1: 여러 조건 중 하나를 충족하는 행 삭제 df = df. loc [ ~ ((df[' col1 '] == ' A ') | (df[' col2 '] > 6 ))]...