Как оценить стандартное отклонение любой гистограммы
Гистограмма предоставляет полезный способ визуализации распределения значений в наборе данных.
Ось X гистограммы отображает группы значений данных, а ось Y сообщает нам, сколько наблюдений в наборе данных находится в каждой группе.
Поскольку гистограмма помещает наблюдения в ячейки, невозможно вычислить точное стандартное отклонение набора данных, представленного гистограммой, но можно оценить стандартное отклонение.
В следующем примере показано, как это сделать.
Связанный: Как оценить среднее и медиану любой гистограммы
Как оценить стандартное отклонение гистограммы
Чтобы оценить стандартное отклонение гистограммы, необходимо сначала оценить среднее значение.
Для оценки среднего значения мы можем использовать следующую формулу:
Среднее: Σm i n i / N
Золото:
- m i : Середина i- го бункера
- n i : частота i -го интервала
- N: общий размер выборки
Например, предположим, что у нас есть следующая гистограмма:
Вот как оценить среднее значение этой гистограммы:
Мы оцениваем среднее значение в 22,89 .
Примечание. Середину каждой группы можно найти, взяв среднее значение нижнего и верхнего значений диапазона. Например, середина первой группы рассчитывается так: (1+10)/2 = 5,5.
Теперь, когда у нас есть оценка среднего значения, мы можем использовать следующую формулу для оценки стандартного отклонения:
Стандартное отклонение: √ Σn i (m i -μ) 2 / (N-1)
Золото:
- n i : частота i -го интервала
- m i : Середина i- го бункера
- μ : Среднее значение
- N: общий размер выборки
Вот как мы применим эту формулу к нашему набору данных:
Мы оцениваем стандартное отклонение набора данных в 9,6377 .
Хотя не гарантируется, что оно точно соответствует стандартному отклонению набора данных (поскольку мы не знаем необработанных значений данных набора данных), оно представляет собой нашу лучшую оценку стандартного отклонения.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи, связанные с данными, сгруппированными в группы:
Как найти дисперсию сгруппированных данных
Как найти медиану сгруппированных данных
Как найти режим сгруппированных данных