자기 상관은 연속적인 시간 간격에 걸쳐 시계열과 지연된 버전 간의 유사성 정도를 측정합니다. 변수의 현재 값과 과거 값 사이의 관계를 측정하기 때문에 “계열 상관” 또는 “지연 상관”이라고도 합니다. 시계열의 자기상관관계가 높으면 과거 값을 참고하는 것만으로도 미래 값을 예측하기 쉬워집니다. R에서 자기상관을...
두 벡터 A와 B 사이의 유클리드 거리는 다음과 같이 계산됩니다. 유클리드 거리 = √ Σ(A i -B i ) 2 Python에서 두 벡터 사이의 유클리드 거리를 계산하려면 numpy.linalg.norm 함수를 사용할 수 있습니다. #import functions import numpy as np from numpy. linalg...
데이터세트를 표준화한다는 것은 데이터세트의 모든 값을 평균값이 0, 표준편차가 1이 되도록 조정하는 것을 의미합니다. 이를 수행하는 가장 일반적인 방법은 다음 공식을 사용하여 값의 크기를 조정하는 z-점수 표준화를 사용하는 것입니다. ( xi – x ) / 초 금: x i : 데이터세트의...
R에서 빈 데이터 프레임을 생성하는 두 가지 기본 방법이 있습니다. 방법 1: 열 이름이 포함된 행렬 #create data frame with 0 rows and 3 columns df <- data.frame(matrix(ncol = 3, nrow = 0)) #provide column names colnames(df) <- c(' var1 ',...
다음 방법 중 하나를 사용하여 R의 데이터 프레임에 하나 이상의 행을 빠르게 추가할 수 있습니다. 방법 1: rbind()를 사용하여 데이터 프레임을 추가합니다. rbind(df1, df2) 방법 2: nrow()를 사용하여 행을 추가합니다. df[nrow(df) + 1,] = c(value1, value2, ...) 이 튜토리얼에서는 이러한 각...
R 프로그래밍 언어는 R 작업 영역에서 개체를 표시하고 삭제하는 데 유용한 두 가지 기능을 제공합니다. ls(): 현재 작업공간의 모든 객체를 나열합니다. rm(): 현재 작업 공간에서 하나 이상의 개체를 제거합니다. 이 튜토리얼에서는 rm() 함수를 사용하여 R에서 데이터 프레임을 삭제하는 방법과 ls() 함수를...
R의 날짜에서 연도를 빠르게 추출하는 방법에는 두 가지가 있습니다. 방법 1: format() 사용 df$year <- format( as.Date (df$date, format=" %d/%m/%Y ")," %Y ") 방법 2: 윤활 패키지 사용 library (lubridate) df$year <- year( mdy (df$date)) 이 튜토리얼에서는 이러한 각 방법을 실제로...
Excel의 VLOOKUP 함수를 사용하면 열에서 일치하는 값을 테이블에서 찾을 수 있습니다. 예를 들어 다음 Excel 스프레드시트에서는 VLOOKUP을 사용하여 플레이어의 이름을 일치시키고 플레이어의 팀을 반환함으로써 플레이어의 팀 이름을 검색할 수 있습니다. 기본 R 또는 dplyr 패키지를 사용하여 이 기능을 복제할 수 있습니다....
gsub() 함수를 사용하면 R의 데이터 프레임 열에서 달러 기호와 쉼표를 쉽게 제거할 수 있습니다. 이 튜토리얼에서는 이 기능의 실제 사용에 대한 세 가지 예를 보여줍니다. R에서 달러 기호 제거 다음 코드는 R의 데이터 프레임에 있는 특정 열에서 달러 기호를 제거하는 방법을...