통계학자 와 데이터 과학자 모두 데이터 관련 작업을 많이 하지만 두 직업 사이에는 몇 가지 주요 차이점이 있습니다. 차이점 #1(데이터 유형) – 데이터 과학자는 불완전한 데이터를 수집하고 정리하는 데 더 많은 시간을 소비하는 경향이 있는 반면, 통계학자는 일반적으로 깔끔한 데이터를 보유합니다....
INDEX 및 MATCH와 함께 다음 기본 수식을 사용하여 Excel에서 여러 값을 세로로 반환할 수 있습니다. =IFERROR(INDEX( $B$2:$B$11 ,SMALL(IF( $D$2 = $A$2:$A$11 ,ROW( $A$2:$A$11 )-ROW( $A$2 )+1), ROW( 1:1 )))),"") 이 특정 수식은 A2:A11 범위의 해당 값이 D2 셀의 값과 동일한 B2:B11...
Google 스프레드시트에서 VLOOKUP을 사용하여 여러 기준에 따라 값을 찾는 경우가 많습니다. 예를 들어 다음 두 데이터 세트가 있고 오른쪽 데이터 세트에서 VLOOKUP을 사용하여 팀 열과 왼쪽 데이터 세트 위치 열의 값과 모두 일치하는 포인트 열의 값을 반환한다고 가정해 보겠습니다. 다음 단계별...
기본적으로 Google 스프레드시트의 VLOOKUP 함수는 범위에서 값을 검색하고 첫 번째 일치 항목에 대해서만 일치하는 값을 반환합니다. 그러나 다음 구문을 사용하여 범위의 값을 검색하고 모든 일치 항목 에 대해 일치하는 값을 반환할 수 있습니다. =FILTER( C2:C11 , E2 = A2:A11 ) 이...
scale_x_discrete() 함수를 사용하여 ggplot2의 플롯에서 x축 레이블을 변경할 수 있습니다. p + scale_x_discrete(labels=c(' label1 ', ' label2 ', ' label3 ', ...)) 다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다. 예: ggplot2에서 X축 레이블 변경 서로 다른 농구팀이 득점한 점수를 보여주는...
CSV 파일을 Pandas DataFrame으로 읽을 때 다음 방법을 사용하여 행을 건너뛸 수 있습니다. 방법 1: 특정 행 건너뛰기 #import DataFrame and skip 2nd row df = pd. read_csv ('my_data.csv', skiprows=[ 2 ]) 방법 2: 여러 특정 행 무시 #import DataFrame and...
다음 방법을 사용하여 NumPy 배열의 최대값 인덱스를 가져올 수 있습니다. 방법 1: 1차원 배열에서 최대값의 인덱스 가져오기 x. argmax () 방법 2: 다차원 배열의 각 행에서 최대값의 인덱스를 가져옵니다. x. argmax (axis= 1 ) 방법 3: 다차원 배열의 각 열에서 최대값의...
다음 방법을 사용하면 R의 dplyr 및 Tidyr 패키지 함수를 사용하여 NA 값을 평균으로 바꿀 수 있습니다. 방법 1: NA 값을 열의 평균으로 대체 df %>% mutate(across(col1, ~replace_na(., mean(., na. rm = TRUE )))) 방법 2: 여러 열의 NA 값을 평균으로 대체...
R의 dplyr 및 Tidyr 패키지의 함수를 사용하여 NA 값을 중앙값으로 바꾸려면 다음 방법을 사용할 수 있습니다. 방법 1: NA 값을 열의 중앙값으로 대체 df %>% mutate(across(col1, ~replace_na(., median(., na. rm = TRUE )))) 방법 2: NA 값을 여러 열의 중앙값으로 대체...
다음 기본 구문을 사용하여 Excel의 다른 통합 문서에서 VLOOKUP을 수행할 수 있습니다. =VLOOKUP( A2 ,'[data2.xlsx]Sheet1'!$A$1:$B$11,2,0) 이 특정 수식은 data2.xlsx 라는 두 번째 통합 문서의 A1:B11 범위에 있는 현재 통합 문서의 A2 셀에서 값을 찾고 두 번째 열에 해당 값을 반환합니다. 참고...