Медиана

В этой статье объясняется, что такое медиана набора данных и как найти медиану для несгруппированных и сгруппированных данных. Кроме того, вы можете рассчитать медиану любого ряда данных с помощью онлайн-калькулятора в конце.

Что такое медиана?

В статистике медиана — это среднее значение всех данных, упорядоченных от меньшего к большему. Другими словами, медиана делит упорядоченный набор данных на две равные части.

Медиана — это мера центрального положения, используемая для описания распределения вероятностей.

медиана

👉 Вы можете использовать калькулятор ниже, чтобы рассчитать медиану любого набора данных.

Вообще термин «Я» часто используется как символ середины.

Другими мерами центрального положения являются средние и модальные, ниже мы увидим различия между ними. Аналогично, мерами нецентрального положения являются квартили, квинтили, децили, процентили и т. д.

Следует отметить, что медиана набора данных совпадает со вторым квартилем, пятым децилем и 50-м процентилем.

Как рассчитать медиану

Расчет медианы зависит от того, является ли общее количество данных четным или нечетным:

  • Если общее количество данных нечетное , медианой будет значение, попадающее прямо в середину данных. То есть значение, которое находится в позиции (n+1)/2 отсортированных данных.
  • Me=x_{\frac{n+1}{2}

  • Если общее количество точек данных четное , медиана будет средним значением двух точек данных, расположенных в центре. То есть среднее арифметическое значений, которые находятся в позициях n/2 и n/2+1 упорядоченных данных.
  • Me=\cfrac{x_{\frac{n}{2}}+x_{\frac{n}{2}+1}}{2}

Золото

n

— общее количество элементов данных в выборке.

Примеры расчета медианы

Чтобы вы могли увидеть, как рассчитывается медиана, ниже приведены два реальных примера, по одному для каждого случая. Сначала будет рассчитана медиана нечетного набора данных, затем будет рассчитана медиана с использованием четного набора данных.

Медиана нечетных данных

  • Рассчитайте медиану следующих данных: 3, 4, 1, 6, 7, 4, 8, 2, 8, 4, 5.

Первое, что нам нужно сделать перед выполнением вычислений, это упорядочить данные, то есть расставить числа от меньшего к большему.

1 \ 2 \ 3 \ 4 \ 4 \ 4 \ 5 \ 6 \ 7 \ 8 \ 8

В данном случае у нас 11 наблюдений, поэтому общее количество данных нечетное. Поэтому мы применяем следующую формулу для расчета положения медианы:

\cfrac{n+1}{2}=\cfrac{11+1}{2}=6

Таким образом, медианой будут данные, расположенные на шестой позиции, что в данном случае соответствует значению 4.

Me=x_6=4

медиана четных данных

  • Какова медиана следующих наблюдений? 2, 6, 2, 8, 9, 4, 7, 11, 4, 13

Чтобы получить медиану, необходимо сначала отсортировать все данные в порядке возрастания:

2 \ 2 \ 4 \ 4 \ 6 \ 7 \ 8 \ 9 \ 11 \ 13

Этот пример отличается от предыдущего, поскольку на этот раз у нас всего 10 наблюдений, что является четным числом. Поэтому процедура определения среднего немного сложнее.

Сначала необходимо вычислить две центральные позиции, между которыми будет найдена медиана, для этого необходимо применить следующие две формулы:

\cfrac{n}{2}=\cfrac{10}{2}=5

\cfrac{n}{2}+1=\cfrac{10}{2}+1=6

Таким образом, медиана будет находиться между пятой и шестой позицией, что соответствует значениям 6 и 7 соответственно. Конкретно медиана будет средним арифметическим указанных значений:

Me=\cfrac{x_5+x_6}{2}=\cfrac{6+7}{2}=6,5

медианный калькулятор

Введите набор статистических данных в следующий калькулятор, чтобы рассчитать его медиану. Данные должны быть разделены пробелом и введены с использованием точки в качестве десятичного разделителя.

Медиана для сгруппированных данных

Чтобы вычислить медиану, когда данные сгруппированы в интервалы, необходимо сначала найти интервал или интервал, в который попадает медиана, используя следующую формулу:

\cfrac{n+1}{2}

Таким образом, медиана будет находиться в интервале, совокупная абсолютная частота которого сразу больше числа, полученного с помощью предыдущего алгебраического выражения.

И как только мы узнаем интервал, к которому принадлежит медиана, мы должны применить следующую формулу, чтобы найти точное значение медианы:

Me=L_i+ \cfrac{\displaystyle\frac{n+1}{2}-F_{i-1}}{f_i}\cdot I_i

Золото:

  • Li — нижняя граница интервала, в котором лежит медиана.
  • n — общее количество наблюдений.
  • F i-1 представляет собой накопленную абсолютную частоту предыдущего интервала.
  • f i — абсолютная частота интервала, в котором лежит медиана.
  • I i – ширина среднего интервала.

В качестве примера ниже вы решили упражнение, в котором вычисляется медиана данных, сгруппированных по интервалам.

медиана объединенных данных

Чтобы найти медиану набора данных, нам сначала нужно определить диапазон, в который она попадает. Для этого воспользуемся следующей формулой:

\cfrac{n+1}{2}=\cfrac{30+1}{2} =15,5 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [60,70)

Таким образом, медиана будет находиться в интервале, чья совокупная абсолютная частота сразу превышает 15,5, что в данном случае является интервалом [60,70), чья совокупная абсолютная частота равна 26. И как только мы узнаем медианный интервал, мы применим вторую формулу процесс:

Me=L_i+ \cfrac{\displaystyle\frac{n+1}{2}-F_{i-1}}{f_i}\cdot I_i

Me=60+\cfrac{\displaystyle\frac{30+1}{2}-15}{11}\cdot 10=60,45

В конечном итоге медиана объединенного набора данных составляет 60,45. Как видите, в задачах такого типа медиана обычно представляет собой десятичное число.

медиана, среднее значение и мода

В этом последнем разделе мы увидим, в чем разница между медианой, средним значением и модой. Ну, это три статистических показателя центрального положения, но их значение разное.

Как мы видели, медиана определяется как значение, занимающее центральное положение при упорядочении данных.

Напротив, среднее значение — это среднее значение всех статистических данных. Чтобы вычислить среднее значение, необходимо сложить все данные, а затем разделить результат на количество точек данных.

Наконец, мода — это наиболее повторяющееся значение в ряду данных.

Как видите, все три статистических показателя помогают описать распределение вероятностей, поскольку дают представление о его центральных значениях. Однако ни одна мера не лучше другой, они просто относятся к разным понятиям.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *