Pandas DataFrame의 행과 열을 선택할 때 .loc 및 .at는 일반적으로 사용되는 두 가지 기능입니다. 두 기능의 미묘한 차이점은 다음과 같습니다. .loc는 여러 행과 열을 입력 인수로 사용할 수 있습니다. .at는 단일 행과 열만 입력 인수로 사용할 수 있습니다. 다음 예는 다음...
NumPy Where() 함수를 사용하면 if-else 논리를 사용하여 NumPy 배열의 값을 빠르게 업데이트할 수 있습니다. 예를 들어, 다음 코드는 특정 조건을 충족하는 NumPy 배열의 값을 업데이트하는 방법을 보여줍니다. import numpy as np #create NumPy array of values x = np. array ([1,...
Pandas 피벗 테이블에 부분합을 추가하려는 경우가 종종 있습니다. 다행히도 pandas의 내장 기능을 사용하면 쉽게 할 수 있습니다. 다음 예에서는 이를 수행하는 방법을 보여줍니다. 예: Pandas PivotTable에 소계 추가 다양한 농구 선수에 대한 정보가 포함된 다음과 같은 pandas DataFrame이 있다고 가정합니다. import...
다음 기본 구문을 사용하여 특정 열의 값 합계를 표시하는 pandas의 피벗 테이블을 만들 수 있습니다. p.d. pivot_table (df, values=' col1 ', index=' col2 ', columns=' col3 ', aggfunc=' sum ') 다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다. 예: 값 합계를...
pandas를 사용할 때 발생할 수 있는 오류는 다음과 같습니다. ValueError : Cannot mask with non-boolean array containing NA / NaN values 이 오류는 일반적으로 특정 문자열이 포함된 pandas DataFrame의 행을 찾으려고 할 때 발생하지만 검색 중인 열에 NaN 값이 있습니다. 다음...
R에서 발생할 수 있는 오류는 다음과 같습니다. Error: `data` must be a data frame, or other object coercible by `fortify()`, not a digital vector 이 오류는 ggplot2를 사용하여 데이터 프레임의 변수를 플롯하려고 시도했지만 데이터 인수에 대해 데이터 프레임 대신 벡터를 참조할...
dplyr 패키지의 함수를 사용하여 R의 데이터 프레임에서 여러 값을 바꾸려면 다음 기본 구문을 사용할 수 있습니다. library (dplyr) df %>% mutate(var1 = recode(var1, ' oldvalue1 ' = ' newvalue1 ', ' oldvalue2 ' = ' newvalue2 '), var2 = recode(var2, '...
dplyr 패키지의 함수를 사용하여 데이터 프레임의 특정 열에 있는 문자열을 바꾸려면 다음 방법을 사용할 수 있습니다. 방법 1: 문자열을 새 문자열로 바꾸기 library (dplyr) library (stringr) df %>% mutate(across(' column_name ', str_replace, ' old_value ', ' new_value ')) 방법 2: 여러...
R의 dplyr 패키지에 있는 across() 함수를 사용하여 여러 열에 변환을 적용할 수 있습니다. 이 기능을 사용하는 방법은 무수히 많지만 다음 방법은 몇 가지 일반적인 용도를 보여줍니다. 방법 1: 여러 열에 함수 적용 #multiply values in col1 and col2 by 2 df...
dplyr을 사용하여 데이터 프레임에 있는 여러 열의 값을 합산하려면 다음 방법을 사용할 수 있습니다. 방법 1: 모든 열의 합계 df %>% mutate(sum = rowSums(., na. rm = TRUE )) 방법 2: 모든 숫자 열의 합계 df %>% mutate(sum = rowSums(across(where(is. numeric...