Как оценить стандартное отклонение любой гистограммы


Гистограмма предоставляет полезный способ визуализации распределения значений в наборе данных.

Ось X гистограммы отображает группы значений данных, а ось Y сообщает нам, сколько наблюдений в наборе данных находится в каждой группе.

Гистограмма Среднее

Поскольку гистограмма помещает наблюдения в ячейки, невозможно вычислить точное стандартное отклонение набора данных, представленного гистограммой, но можно оценить стандартное отклонение.

В следующем примере показано, как это сделать.

Связанный: Как оценить среднее и медиану любой гистограммы

Как оценить стандартное отклонение гистограммы

Чтобы оценить стандартное отклонение гистограммы, необходимо сначала оценить среднее значение.

Для оценки среднего значения мы можем использовать следующую формулу:

Среднее: Σm i n i / N

Золото:

  • m i : Середина i- го бункера
  • n i : частота i -го интервала
  • N: общий размер выборки

Например, предположим, что у нас есть следующая гистограмма:

Среднее значение гистограммы

Вот как оценить среднее значение этой гистограммы:

Формула усреднения сгруппированных данных

Мы оцениваем среднее значение в 22,89 .

Примечание. Середину каждой группы можно найти, взяв среднее значение нижнего и верхнего значений диапазона. Например, середина первой группы рассчитывается так: (1+10)/2 = 5,5.

Теперь, когда у нас есть оценка среднего значения, мы можем использовать следующую формулу для оценки стандартного отклонения:

Стандартное отклонение:Σn i (m i -μ) 2 / (N-1)

Золото:

  • n i : частота i -го интервала
  • m i : Середина i- го бункера
  • μ : Среднее значение
  • N: общий размер выборки

Вот как мы применим эту формулу к нашему набору данных:

Оцените стандартное отклонение гистограммы Мы оцениваем стандартное отклонение набора данных в 9,6377 .

Хотя не гарантируется, что оно точно соответствует стандартному отклонению набора данных (поскольку мы не знаем необработанных значений данных набора данных), оно представляет собой нашу лучшую оценку стандартного отклонения.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи, связанные с данными, сгруппированными в группы:

Как найти дисперсию сгруппированных данных
Как найти медиану сгруппированных данных
Как найти режим сгруппированных данных

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *