[카테고리:] 가이드

Pandas: 여러 열을 그룹화하고 집계하는 방법

Pandas DataFrame의 여러 열을 그룹화하고 집계하려는 경우가 종종 있습니다. 다행히도 pandas .groupby() 및 .agg() 함수를 사용하면 이 작업을 쉽게 수행할 수 있습니다. 이 튜토리얼에서는 이러한 기능의 실제 사용에 대한 몇 가지 예를 설명합니다. 예 1: 두 개의 열로 그룹화하고 평균 찾기...

Python에서 shapiro-wilk 테스트를 수행하는 방법

Shapiro-Wilk 테스트는 정규성 테스트입니다. 표본이 정규 분포 에서 나오는지 여부를 확인하는 데 사용됩니다. Python에서 Shapiro-Wilk 테스트를 수행하려면 다음 구문을 사용하는 scipy.stats.shapiro() 함수를 사용할 수 있습니다. scipy.stats.shapiro(x) 금: x: 샘플 데이터 테이블입니다. 이 함수는 검정 통계량과 해당 p-값을 반환합니다. p-값이 특정 유의...

Python에서 kolmogorov-smirnov 테스트를 수행하는 방법

Kolmogorov-Smirnov 테스트는 표본이 특정 분포에서 나오는지 여부를 테스트하는 데 사용됩니다. Python에서 Kolmogorov-Smirnov 테스트를 수행하려면 단일 샘플 테스트에 scipy.stats.kstest()를 사용하거나 2샘플 테스트에 scipy.stats.ks_2samp()를 사용할 수 있습니다. 이 튜토리얼에서는 각 기능을 실제로 사용하는 방법의 예를 보여줍니다. 예 1: Kolmogorov-Smirnov 테스트 샘플 다음과 같은...

Pandas의 계층화된 샘플링(예제 포함)

연구자들은 종종 모집단에서 표본을 채취하고 표본의 데이터를 사용하여 모집단 전체에 대한 결론을 도출합니다. 일반적으로 사용되는 샘플링 방법은 계층화 무작위 샘플링 으로, 모집단을 그룹으로 나누고 각 그룹에서 특정 수의 구성원을 무작위로 선택하여 표본에 포함시킵니다. 이 튜토리얼에서는 Python에서 계층화된 무작위 샘플링을 수행하는 두...

Matplotlib: 값별로 산점도 색상을 지정하는 방법

세 번째 변수를 기반으로 matplotlib 산점도의 점 색상을 음영 처리하려는 경우가 종종 있습니다. 다행히도 다음 구문을 사용하는 matplotlib.pyplot.scatter() 함수를 사용하면 쉽게 수행할 수 있습니다. matplotlib.pyplot.scatter(x, y, s=없음, c=없음, cmap=없음) 금: x: 플롯에서 x축 위치에 사용할 값 테이블입니다. y: 플롯의 y축 위치에...

Matplotlib에서 등고선 플롯을 만드는 방법

등고선 플롯은 등고선을 사용하여 3차원 데이터를 2차원으로 시각화할 수 있는 플롯 유형입니다. 다음 두 함수를 사용하여 Matplotlib에서 등고선 플롯을 생성할 수 있습니다. matplotlib.pyplot.contour() – 등고선 플롯을 생성합니다. matplotlib.pyplot.contourf() – 채워진 등고선 플롯을 생성합니다. 다음 예에서는 이 두 기능을 실제로 사용하는 방법을...

Matplotlib 플롯에서 진드기를 제거하는 방법

Matplotlib 플롯의 하나 이상의 축에서 눈금 표시를 제거하려는 경우가 종종 있습니다. 다행스럽게도 이는 Tick_params() 함수를 사용하여 쉽게 수행할 수 있습니다. 이 튜토리얼에서는 다음 산점도를 기반으로 실제로 이 기능을 사용하는 방법에 대한 몇 가지 예를 보여줍니다. import matplotlib.pyplot as plt #createdata x...