귀속 위험이란 위험 요인에 노출된 사람과 해당 위험 요인에 노출되지 않은 사람 사이의 발생률 차이를 의미합니다. 예를 들어, 이 측정값을 사용하여 흡연자(노출된 사람)와 비흡연자(비노출된 사람) 간의 심혈관 질환(발생률)의 차이를 이해할 수 있습니다. 일반적으로 우리는 위험 요인에 기인할 수 있는 발생률의 백분율을...
선형 회귀 는 하나 이상의 예측 변수와 반응 변수 간의 관계를 수량화하는 데 사용할 수 있는 방법입니다. 우리는 일반적으로 양적 변수를 사용하는 선형 회귀를 사용합니다. 때때로 “숫자” 변수라고도 불리는 이는 측정 가능한 양을 나타내는 변수입니다. 예는 다음과 같습니다: 집의 평방 피트...
더미 변수는 범주형 변수를 0 또는 1의 두 값 중 하나를 취하는 숫자 변수로 나타낼 수 있도록 회귀 분석에서 생성하는 변수 유형입니다. 예를 들어, 다음과 같은 데이터 세트가 있고 나이 와 결혼 상태를 사용하여 소득을 예측한다고 가정해 보겠습니다. 회귀 모델에서 결혼...
더미 변수는 범주형 변수를 0 또는 1의 두 값 중 하나를 취하는 숫자 변수로 나타낼 수 있도록 회귀 분석에서 생성하는 변수 유형입니다. 예를 들어, 다음과 같은 데이터 세트가 있고 나이 와 결혼 상태를 사용하여 소득을 예측한다고 가정해 보겠습니다. 회귀 모델에서 결혼...
선형 회귀 는 하나 이상의 예측 변수와 반응 변수 간의 관계를 수량화하는 데 사용할 수 있는 방법입니다. 우리는 일반적으로 양적 변수를 사용하는 선형 회귀를 사용합니다. 때때로 “숫자” 변수라고도 불리는 이는 측정 가능한 양을 나타내는 변수입니다. 예는 다음과 같습니다: 집의 평방 피트...
때때로 상호교환적으로 사용되는 두 가지 용어는 상관관계(correlation) 와 연관(association) 입니다. 그러나 통계 분야에서는 이 두 용어가 약간 다른 의미를 갖습니다. 특히 상관관계라는 단어를 사용할 때는 일반적으로 피어슨 상관계수(Pearson Correlation Coefficient)를 의미합니다. 이는 두 개의 확률 변수 X 와 Y 사이의 선형...
DATEDIF() 함수를 사용하여 Excel에서 두 날짜의 차이를 계산할 수 있습니다. 이 함수는 다음 구문을 사용합니다. =DATEDIF(시작_날짜, 종료_날짜, 측정항목) 금: Start_Date: 시작 날짜 End_Date: 종료 날짜 측정항목: 계산할 측정항목입니다. 옵션은 다음과 같습니다: “d”: 일 “m”: 월 “y”: 년 셀 중 하나에 =DATEDIF(를...
통계에서는 미래 사건이 일어날 확률이 과거 사건의 발생에 영향을 받지 않는 경우 확률 분포 를 기억 없는 특성을 갖는다고 말합니다. 기억 없는 속성에는 두 가지 확률 분포만 있습니다. 음수가 아닌 실수를 갖는 지수 분포 . 음수가 아닌 정수를 갖는 기하학적 분포입니다...
pmax() 함수를 사용하여 R의 여러 열에서 최대값을 찾을 수 있습니다. 이 함수는 다음 구문을 사용합니다. pmax(…, na.rm = 거짓) 금: … : 벡터 목록 na.rm: 누락된 값을 제거해야 하는지 여부를 나타내는 논리 요소입니다. 기본값은 false입니다. 이 튜토리얼에서는 다음 데이터 프레임을 사용하여...
R의 stringr 패키지의 str_replace() 함수는 문자열에서 일치하는 패턴을 바꾸는 데 사용할 수 있습니다. 이 함수는 다음 구문을 사용합니다. str_replace(문자열, 패턴, 교체) 금: 문자열: 문자형 벡터 model: 검색할 모델 replacement: 대체 문자의 벡터 이 튜토리얼에서는 다음 데이터 프레임에서 이 함수를 실제로 사용하는...