종종 “보다 큼” 필터를 사용하여 Excel의 피벗 테이블에 있는 값을 필터링하려는 경우가 있습니다. 다행히 피벗 테이블의 행 레이블 열에 있는 값 필터 드롭다운 메뉴를 사용하면 쉽게 이 작업을 수행할 수 있습니다. 다음 예에서는 이 작업을 수행하는 방법을 정확하게 보여줍니다. 예: ‘보다...
기본 R 플롯에서 범례의 크기를 변경하는 가장 간단한 방법은 cex 인수를 사용하는 것입니다. legend(' topright ', legend=c(' A ', ' B '), col=1:2, pch= 16 , cex= 1 ) cex의 기본값은 1입니다. cex 에 지정한 값이 클수록 범례도 커집니다. 다음 예에서는...
다음 방법을 사용하여 Pandas DataFrame에 있는 열의 데이터 유형( dtype )을 확인할 수 있습니다. 방법 1: 열 유형 확인 df. column_name . dtype 방법 2: 모든 열의 유형 확인 df. dtypes 방법 3: 특정 유형이 있는 열 확인 df. dtypes [df....
다음 방법 중 하나를 사용하여 Python의 사전을 pandas DataFrame으로 변환할 수 있습니다. 방법 1: dict.items() 사용 df = pd. DataFrame (list(some_dict. items ()), columns = [' col1 ', ' col2 ']) 방법 2: from_dict() 사용 df = pd. DataFrame . from_dict...
통계에서 Jaro-Winkler 유사성은 두 문자열 간의 유사성을 측정하는 방법입니다. 두 문자열 간의 Jaro 유사성 (sim j )은 다음과 같이 정의됩니다. 시뮬레이션 j = 1/3 * (m /|s 1 | + m/|s 2 | + (mt)/m ) 금: m : 일치하는 문자...
기계 학습에서 분류 모델을 사용할 때 세 가지 공통 측정항목을 사용하여 모델 품질을 평가합니다. 1. 정확도 : 전체 긍정적 예측 대비 올바른 긍정적 예측의 비율입니다. 2. 재현율(Recall) : 전체 실제 긍정 대비 올바른 긍정 예측의 비율입니다. 3. F1 점수 : 정밀도와...
기계 학습 모델을 데이터 세트에 맞출 때 데이터 세트를 두 세트로 나누는 경우가 많습니다. 1. 훈련 세트: 모델을 훈련하는 데 사용됩니다(원래 데이터 세트의 70-80%) 2. 테스트 세트: 모델 성능의 편견 없는 추정치를 얻는 데 사용됩니다(원래 데이터 세트의 20-30%) Python에는 Pandas DataFrame을...
기존 DataFrame에서 새 Pandas DataFrame을 만드는 세 가지 일반적인 방법이 있습니다. 방법 1: 이전 DataFrame의 여러 열을 사용하여 새 DataFrame 만들기 new_df = old_df[[' col1 ', ' col2 ']]. copy () 방법 2: 이전 DataFrame의 열을 사용하여 새 DataFrame 만들기 new_df...
pandas에서 fill_value 인수를 사용하여 피벗 테이블의 NaN 값을 0으로 바꿀 수 있습니다. 이를 위해 다음 기본 구문을 사용할 수 있습니다. p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', fill_value= 0 ) 다음 예에서는 실제로 이 구문을 사용하는...