Python에서 표본 및 모집단 분산을 계산하는 방법
분산은 데이터 세트의 값 분포를 측정하는 방법입니다.
모집단 분산을 계산하는 공식은 다음과 같습니다.
σ 2 = Σ ( xi – μ) 2 / N
금:
- Σ : 합계를 뜻하는 기호
- μ : 인구 평균
- x i : 모집단의 i 번째 요소
- N : 인구 규모
표본 분산을 계산하는 공식은 다음과 같습니다.
s 2 = Σ (x i – x ) 2 / (n-1)
금:
- x : 표본 평균
- x i : 샘플의 i 번째 요소
- n : 표본 크기
Python 통계 라이브러리의 분산 및 p분산 함수를 사용하여 주어진 테이블에 대한 표본 분산과 모집단 분산을 각각 빠르게 계산할 수 있습니다.
from statistics import variance, pvariance #calculate sample variance variance(s) #calculate population variance pvariance(x)
다음 예에서는 각 기능을 실제로 사용하는 방법을 보여줍니다.
예 1: Python에서 표본 분산 계산
다음 코드는 Python에서 테이블의 표본 분산을 계산하는 방법을 보여줍니다.
from statistics import variance #define data data = [4, 8, 12, 15, 9, 6, 14, 18, 12, 9, 16, 17, 17, 20, 14] #calculate sample variance variance(data) 22,067
표본 분산은 22.067 입니다.
예제 2: Python에서 모집단 분산 계산
다음 코드는 Python에서 테이블의 모집단 분산을 계산하는 방법을 보여줍니다.
from statistics import pvariance #define data data = [4, 8, 12, 15, 9, 6, 14, 18, 12, 9, 16, 17, 17, 20, 14] #calculate sample variance pvariance(data) 20,596
모집단 분산은 20,596 으로 나타납니다.
표본 및 모집단 분산 계산에 대한 참고 사항
표본 및 모집단 분산을 계산할 때 다음 사항에 유의하세요.
- 작업 중인 데이터 세트가 전체 모집단, 즉 관심 있는 모든 값을 나타낼 때 모집단 분산을 계산해야 합니다.
- 작업 중인 데이터 세트가 더 큰 관심 모집단에서 가져온 표본을 나타낼 때 표본 분산을 계산해야 합니다.
- 주어진 데이터 테이블의 표본 분산은 동일한 데이터 테이블의 모집단 분산보다 항상 큽니다. 왜냐하면 표본 분산을 계산할 때 더 많은 불확실성이 있기 때문에 분산에 대한 추정치가 더 커지기 때문입니다.
추가 리소스
다음 튜토리얼에서는 Python에서 다른 스프레드 측정항목을 계산하는 방법을 설명합니다.
Python에서 사분위수 범위를 계산하는 방법
Python에서 변동 계수를 계산하는 방법
Python에서 목록의 표준 편차를 계산하는 방법