값의 백분위수 순위는 순위가 주어진 값과 같거나 낮은 데이터세트의 값의 백분율을 알려줍니다. 다음 방법을 사용하여 팬더에서 백분위수 순위를 계산할 수 있습니다. 방법 1: 열의 백분위수 순위 계산 df[' percent_rank '] = df[' some_column ']. rank (pct= True ) 방법 2: 그룹별...
explain() 함수를 사용하여 Pandas DataFrame의 변수에 대한 설명 통계를 생성할 수 있습니다. 다음 기본 구문을 사용하여 Pandas의 groupby () 함수와 함께 explain () 함수를 사용할 수 있습니다. df. groupby (' group_var ')[' values_var ']. describe () 다음 예에서는 실제로 이 구문을...
xarray 모듈을 사용하여 3D Pandas DataFrame을 빠르게 생성할 수 있습니다. 이 튜토리얼에서는 xarray 모듈 기능을 사용하여 다음 pandas 3D DataFrame을 생성하는 방법을 설명합니다. product_A product_B product_C year quarter 2021 Q1 1.624345 0.319039 50 Q2 -0.611756 0.319039 50 Q3 -0.528172 0.319039 50...
z 점수에서 확률을 찾는 가장 쉬운 방법은 단순히 z 테이블에서 z 점수에 해당하는 확률을 찾는 것입니다 . 이 튜토리얼에서는 z 테이블을 사용하여 다음 확률을 찾는 방법을 설명합니다. 값이 특정 z-점수보다 낮을 확률입니다. 값이 특정 z-점수보다 클 확률입니다. 값이 두 개의 특정...
기계 학습 에서 가장 일반적인 클러스터링 알고리즘 중 하나는 k-평균 클러스터링 으로 알려져 있습니다. K-평균 클러스터링은 데이터 세트의 각 관측치를 K 클러스터 중 하나에 배치하는 기술입니다. 최종 목표는 각 클러스터 내의 관측치가 서로 매우 유사한 반면 다른 클러스터의 관측치는 서로 상당히...
다음 방법을 사용하여 Pandas query() 함수에서 LIKE (SQL과 유사)를 사용하여 특정 패턴이 포함된 행을 찾을 수 있습니다. 방법 1: 패턴이 포함된 행 찾기 df. query (' my_column.str.contains("pattern1") ') 방법 2: 여러 패턴 중 하나를 포함하는 행 찾기 df. query (' my_column.str.contains("pattern1|pattern2")...
다음 방법을 사용하여 Pandas DataFrame에서 열 값의 분포를 그릴 수 있습니다. 방법 1: 열의 값 분포 플롯 df[' my_column ']. plot (kind=' kde ') 방법 2: 한 열의 값 분포를 다른 열로 그룹화하여 표시 df. groupby (' group_column ')[' values_column ']....
다음 방법을 사용하여 NumPy 부동 소수점 배열을 정수 배열로 변환할 수 있습니다. 방법 1: 부동 소수점을 정수로 변환(내림) rounded_down_integer_array = float_array. astype (int) 방법 2: 부동 소수점을 정수로 변환(가장 가까운 정수로 반올림) rounded_integer_array = (np. rint (some_floats)). astype (int) 방법 3:...