SAS에서 누락된 값의 개수를 계산하려면 다음 방법을 사용할 수 있습니다. 방법 1: 숫자변수의 결측값 계산 proc means data =my_data NMISS ; run ; 방법 2: 문자변수의 결측값 계산 proc sql; select nmiss(char1) as char1_miss, nmiss(char2) as char2_miss from my_data; quit; 다음...
로지스틱 회귀는 응답 변수가 이진일 때 회귀 모델을 맞추는 데 사용할 수 있는 방법입니다. 로지스틱 회귀 모델이 데이터 세트에 얼마나 잘 맞는지 평가하기 위해 다음 두 가지 측정항목을 살펴볼 수 있습니다. 민감도: 결과가 실제로 긍정적일 때 모델이 관찰에 대한 긍정적인 결과를...
Let’s Make a Deal 이라는 오래된 게임 쇼에서 진행자 Monty Hall은 참가자들에게 세 개의 문을 제시했습니다. 문 중 하나에는 상품이 들어 있었지만 나머지 두 개에는 상품이 들어 있지 않았습니다. Monty는 참가자에게 어느 문에 상품이 들어 있다고 생각하는지 선택하도록 요청했습니다. 참가자가 문을...
FIRST를 사용할 수 있습니다. 그리고 마지막. SAS에서 SAS 데이터 세트의 그룹별 첫 번째 작업과 마지막 관찰을 식별합니다. 각 기능이 수행하는 작업을 요약하면 다음과 같습니다. FIRST.variable_name은 그룹의 첫 번째 관측값에 1 값을 할당하고 그룹의 다른 모든 관측값에는 0 값을 할당합니다. LAST.variable_name은 그룹의...
SAS에서 SELECT-WHEN 문을 사용하여 데이터 세트의 기존 범주형 변수 값을 기반으로 새 변수에 값을 할당할 수 있습니다. 이 문은 다음 기본 구문을 사용합니다. data new_data; set my_data; select (Existing_Column); when ('value1') New_Column= 1 ; when ('value2') New_Column= 2 ; when ('value3')...
다음 방법을 사용하여 R의 그룹당 고유 값 수를 계산할 수 있습니다. 방법 1: 기본 R 사용 results <- aggregate(data=df, values_var~group_var, function (x) length ( unique (x))) 방법 2: dplyr 사용 library (dplyr) results <- df %>% group_by(group_var) %>% summarize(count = n_distinct...
bins 인수를 사용하여 ggplot2 의 히스토그램에 사용할 bin 수를 지정할 수 있습니다. library (ggplot2) ggplot(df, aes (x=x)) + geom_histogram(bins= 10 ) 다음 예에서는 이 인수를 실제로 사용하는 방법을 보여줍니다. 예: ggplot2에서 히스토그램의 bin 수 설정 다음 코드는 평균값이 2인 포아송 분포를...
dplyr 패키지를 사용하여 R에서 날짜별로 데이터 프레임을 필터링하려면 다음 방법을 사용할 수 있습니다. 방법 1: 날짜 이후 행 필터링 df %>% filter(date_column > ' 2022-01-01 ') 방법 2: 날짜 이전의 행 필터링 df %>% filter(date_column < ' 2022-01-01 ') 방법 3:...
dplyr 패키지를 사용하여 R에서 이름으로 데이터 프레임의 열을 선택하려면 다음 방법을 사용할 수 있습니다. 방법 1: 이름으로 특정 열 선택 df %>% select(var1, var3) 방법 2: 이름으로 열 범위 선택 df %>% select(var1:var3) 방법 3: 일부 열을 제외한 모든 열 선택...