Python을 사용할 때 발생할 수 있는 오류는 다음과 같습니다. ValueError : operands could not be broadcast together with shapes (2,2) (2,3) 이 오류는 Python에서 numpy.dot() 함수 대신 곱셈 기호( * )를 사용하여 행렬 곱셈을 수행하려고 할 때 발생합니다. 다음 예에서는 각...
dplyr에서 다음 기본 구문을 사용하여 인덱스 위치별로 데이터 프레임 열을 선택할 수 있습니다. #select columns in specific index positions df %>% select(1, 4, 5) #exclude columns in specific index positions df %>% select(-c(1,2)) 다음 예에서는 다음 데이터 프레임에서 실제로 이 구문을...
통계에서 상대 위험도는 대조군에서 사건이 발생할 확률과 비교하여 치료군에서 사건이 발생할 확률을 나타냅니다. 다음과 같이 계산됩니다. 상대 위험도 = (치료군의 사건 확률) / (대조군의 사건 확률) 일반적으로 상대적 위험 값을 해석하는 방법은 다음과 같습니다. 상대 위험도 < 1 : 치료군에서 사건이...
통계에서 다중 공선성은 두 개 이상의 예측 변수가 서로 높은 상관관계를 갖고 있어 회귀 모델에서 고유하거나 독립적인 정보를 제공하지 않을 때 발생합니다. 변수 간의 상관 정도가 충분히 높으면 회귀 모델을 피팅하고 해석할 때 문제가 발생할 수 있습니다. 다중공선성의 가장 극단적인 경우를...
dplyr을 사용하여 R의 데이터 프레임에서 행을 제거하려면 다음 기본 구문을 사용할 수 있습니다. 1. NA가 있는 행을 삭제합니다. df %>% n / A. omit () 2. 특정 열에서 NA가 있는 행을 삭제합니다. df %>% filter( ! is. na (column_name)) 3. 중복...
R에서 dplyr 및 Tidyr 패키지의 함수를 사용하여 크로스탭을 생성하려면 다음 기본 구문을 사용할 수 있습니다. df %>% group_by (var1, v ar2) %>% tally () %>% spread (var1,n) 다음 예에서는 이 구문을 실제로 사용하는 방법을 보여줍니다. 예 1: 기본 크로스탭 만들기 R에...
크로스탭은 두 범주형 변수 간의 관계를 요약하는 테이블입니다. 다음 단계별 예에서는 Excel에서 크로스탭을 만드는 방법을 설명합니다. 1단계: 데이터 입력 먼저 Excel에 다음 데이터 세트를 입력해 보겠습니다. 2단계: 크로스탭 만들기 그런 다음 상단 리본에 있는 삽입 탭을 클릭한 다음 피벗 테이블 버튼을...
dplyr 패키지의 다음 기능을 사용하여 R에서 그룹별 빈도 테이블을 만들 수 있습니다. library (dplyr) df %>% group_by (var1, var2) %>% summarize (Freq=n()) 다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다. 예: 그룹별 빈도표 만들기 R에 다음과 같은 데이터 프레임이 있다고 가정합니다....
다음 구문을 사용하면 dplyr을 사용하여 인덱스 위치에 따라 데이터 프레임 열의 이름을 바꿀 수 있습니다. 방법 1: 인덱스로 열 이름 바꾸기 #rename column in index position 1 df %>% rename (new_name1 = 1) 방법 2: 인덱스를 기준으로 여러 열의 이름 바꾸기...