막대 그래프 는 다양한 범주형 변수의 수량을 시각화하는 데 유용합니다. 때로는 하위 그룹으로 나누어진 범주형 변수의 양을 시각화하는 막대 그래프를 만들고 싶을 때도 있습니다. 예를 들어, 세 개의 다른 스포츠 경기장에 대한 팝콘과 탄산음료의 총 판매량을 시각화하려고 할 수 있습니다. 이...
통계에서 z-점수는 주어진 값이 평균 에서 얼마나 많은 표준 편차를 가지고 있는지 알려줍니다. 다음 공식을 사용하여 z-점수를 계산합니다. z = (X – μ) / σ 금: X는 단일 원시 데이터 값입니다. μ는 평균이다 σ는 표준편차 개별 값의 z-점수는 다음과 같이 해석될...
통계에서 평균절대오차 (MAE)는 주어진 모델의 정확도를 측정하는 방법입니다. 다음과 같이 계산됩니다. MAE = (1/n) * Σ|y i – x i | 금: Σ: “합계”를 의미하는 그리스 기호 y i : i 번째 관측치에 대한 관측값 x i : i번째 관측치에 대한...
통계에서 인구 비율은 특정 특성을 가진 인구 중 개인의 비율을 나타냅니다. 예를 들어, 특정 도시 주민의 43.8%가 새로운 법안을 지지한다고 가정해 보겠습니다. 값 0.438 은 인구 비율을 나타냅니다. 인구 비율 공식 모집단 비율은 항상 0과 1 사이(또는 백분율로 0%에서 100%)이며 다음과...
도수분포에서 클래스 경계는 클래스를 구분하는 값입니다. 빈도 분포에서 클래스 경계를 계산하려면 다음 단계를 사용합니다. 1. 두 번째 등급의 하한값에서 첫 번째 등급의 상한값을 뺍니다. 2. 결과를 2로 나눕니다. 3. 그 결과를 학급 하한치에서 뺀 결과를 각 학급의 상한치에 더한다. 다음 예에서는...
히스토그램은 데이터 세트의 값 분포를 시각화하는 데 도움이 되는 그래프입니다. 히스토그램에 사용되는 상자의 수는 데이터를 해석하는 방법에 큰 영향을 미칠 수 있는 것으로 나타났습니다. 너무 적은 수의 그룹을 사용하면 데이터의 실제 기본 패턴이 숨겨질 수 있습니다. 그리고 너무 많은 그룹을 사용하면...
왜도는 분포의 대칭성을 설명하는 방법입니다. 분포의 왼쪽에 “꼬리”가 있으면 분포가 편향된 것입니다. 분포의 오른쪽에 “꼬리”가 있는 경우 분포는 오른쪽 으로 치우쳐 있습니다. 그리고 분포가 양쪽에서 대칭이면 편향이 없습니다 . 왼쪽으로 치우친 분포를 “음의 치우침” 분포라고도 하고 오른쪽으로 치우친 분포를 “양으로 치우친”...
pandas fillna() 함수는 pandas DataFrame 열의 누락된 값을 채우는 데 유용합니다. 이 튜토리얼에서는 이 함수를 사용하여 다음 pandas DataFrame의 여러 열에 대한 누락된 값을 채우는 몇 가지 예를 제공합니다. import pandas as pd import numpy as np #createDataFrame df = pd....
Mann-Kendall 추세 테스트는 시계열 데이터에 추세가 있는지 여부를 확인하는 데 사용됩니다. 이는 비모수적 테스트입니다. 즉, 데이터의 정규성에 대한 기본 가정이 이루어지지 않음을 의미합니다. 테스트 가설은 다음과 같습니다. H 0 (귀무가설): 데이터에 추세가 없습니다. HA (대립가설): 데이터에 추세가 존재합니다. (이것은 긍정적일 수도...
히트 맵은 다양한 색상 음영을 사용하여 데이터 값을 나타내는 차트 유형입니다. 이 튜토리얼에서는 다음 데이터 세트와 함께 Seaborn Python 시각화 라이브러리를 사용하여 히트맵을 생성하는 방법을 설명합니다. #import seaborn import seaborn as sns #load "flights" dataset data = sns. load_dataset (“ flights...