group_by() 함수를 사용하여 그룹당 하나의 변수를 요약한 후 dplyr의 ungroup () 함수를 사용하여 행의 그룹을 해제할 수 있습니다. 다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다. 예: dplyr에서 ungroup()을 사용하는 방법 R에 다음과 같은 데이터 프레임이 있다고 가정합니다. #create data frame...
다음 기본 구문을 사용하여 R에서 SVM(지원 벡터 머신) 개체를 그릴 수 있습니다. library (e1071) plot(svm_model, df) 이 예에서 df 는 데이터 프레임 이름이고 svm_model은 svm() 함수를 사용하여 맞는 지원 벡터 머신입니다. 다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다. 예: R에서...
기계 학습에서 레이블 인코딩은 범주형 변수 의 값을 정수 값으로 변환하는 프로세스입니다. 예를 들어 다음 스크린샷에서는 Team 이라는 범주형 변수의 각 고유 값을 알파벳 순서에 따라 정수 값으로 변환하는 방법을 보여줍니다. 다음 구문을 사용하여 Python에서 다중 열 레이블 인코딩을 수행할 수...
Python을 사용할 때 발생할 수 있는 일반적인 오류는 다음과 같습니다. ValueError: Input contains infinity or a value too large for dtype('float64'). 이 오류는 일반적으로 scikit-learn 모듈의 함수를 사용하려고 할 때 발생하지만 입력으로 사용하는 DataFrame이나 행렬에 NaN 값 또는 무한 값이 있습니다....
Python을 사용할 때 발생할 수 있는 일반적인 오류는 다음과 같습니다. TypeError: first argument must be an iterable of pandas objects, you passed an object of type "DataFrame" 이 오류는 일반적으로 DataFrame 이름을 괄호 안에 넣지 않고 concat() 함수를 사용하여 두 개의...
OLS(Ordinary Least Square) 회귀는 하나 이상의 예측 변수와 반응 변수 간의 관계를 가장 잘 설명하는 선을 찾을 수 있는 방법입니다. 이 방법을 사용하면 다음 방정식을 찾을 수 있습니다. ŷ = b0 + b1x 금: ŷ : 예상된 반응값 b 0 :...
다음 구문을 사용하여 데이터를 시간별로 그룹화하고 Pandas에서 집계를 수행할 수 있습니다. df. groupby ([df[' time ']. dt . hour ]). dirty . sum () 이 특정 예에서는 시간별 값을 Hour 라는 열로 그룹화한 다음 각 시간에 대한 Sales 열의 값 합계를...
다음 기본 구문을 사용하여 NumPy에서 NaN 값을 0으로 바꿀 수 있습니다. my_array[np. isnan (my_array)] = 0 이 구문은 행렬과 배열 모두에서 작동합니다. 다음 예에서는 이 구문을 실제로 사용하는 방법을 보여줍니다. 예시 1: NumPy 배열에서 NaN 값을 0으로 바꾸기 다음 코드는 NumPy...