Квантили

Здесь вы узнаете, что такое квантили и как они рассчитываются. Мы также объясним, какие бывают типы квантилей, и вы увидите решенные примеры расчета квантилей. Наконец, вы сможете рассчитать любой квантиль выборки данных с помощью онлайн-калькулятора.

Что такое квантиль?

В статистике квантили — это точки, которые поровну делят набор упорядоченных данных. Таким образом, квантиль указывает значение, ниже которого находится процент данных.

Например, если значение квантиля порядка 0,39 равно 24, это означает, что 39% данных в выборке имеют значение меньше 24, а остальные данные больше 24.

Поэтому квантили используются для разделения данных из распределения на равные группы. Кроме того, они также используются для обозначения процента данных выше или ниже определенного значения.

👉 Вы можете использовать калькулятор ниже для расчета квантилей любого набора данных.

Виды квантилей

Различают следующие типы квантилей:

  • Квартили – квантили, которые делят набор данных на четыре равные части. Таким образом, имеется три квартиля: первый квартиль (Q 1 ), второй квартиль (Q 2 ) и третий квартиль (Q 3 ).
  • Квинтили – квантили, которые делят набор данных на пять равных частей. Таким образом, в выборке может быть только четыре квинтиля. Этот тип квантилей обозначается буквой К.
  • Децили : квантили, которые делят набор данных на десять равных частей. Обозначением децилей является буква Д.
  • Процентили – квантили, которые делят набор данных на сто равных частей. Процентили также указывают процент от выборки. Они названы буквой П.

Одним из свойств, связывающих различные типы квантилей, является то, что медиана, второй квартиль, пятый дециль и 50-й процентиль имеют одинаковое значение.

Кроме того, существуют и другие типы квантилей, но они используются реже. Среди них выделяют терцилии, разделяющие ряд данных на три одинаковые части, и линчеватели, разделяющие собранные данные на двадцать равнозначных частей.

Аналогичным образом, все типы квантилей считаются нецентральными мерами положения.

Как рассчитать квантили

Чтобы вычислить положение квантиля набора статистических данных, необходимо умножить номер квантиля на сумму общего количества данных плюс один.

Таким образом, формула квантиля имеет следующий вид:

p\cdot (n+1)

Обратите внимание: эта формула сообщает нам положение квантиля, а не его значение. Квантилем будут данные, расположенные в позиции, полученной по формуле.

Однако иногда результат этой формулы дает нам десятичное число. Поэтому мы должны различать два случая в зависимости от того, является ли результат десятичным числом или нет:

  • Если результатом формулы является число без десятичной части , квантилем являются данные, находящиеся в позиции, указанной в формуле выше.
  • Если результатом формулы является число с десятичной частью , точное значение квантиля рассчитывается по следующей формуле:

C=x_i+d\cdot (x_{i+1}-x_i)

Где x i и x i+1 — номера позиций, между которыми находится число, полученное по первой формуле, а d — десятичная часть числа, полученного по первой формуле.

Если вы думаете, что вычисление квантиля очень сложное, не волнуйтесь. Прочтите следующие примеры, и вы увидите, что это на самом деле просто.

Примечание . В научном сообществе до сих пор нет единого мнения о том, как вычислять квантили, поэтому вы можете найти книгу по статистике, объясняющую это немного по-другому.

Примеры расчета квантилей

Рассматривая определение квантиля и теорию его расчета, ниже вы найдете решенное упражнение по расчету определенных квантилей. Это поможет вам лучше понять концепцию.

  • Рассчитайте квантиль порядка 0,50 и квантиль порядка 0,81 следующей статистической выборки.

Проблемные данные уже отсортированы по возрастанию, поэтому менять их нет необходимости. В противном случае данные пришлось бы сначала привести в порядок.

Как объяснялось выше, формула для нахождения положения любого квантиля выглядит следующим образом:

p\cdot (n+1)

В этом случае размер выборки составляет 49 наблюдений, поэтому для расчета квантиля 0,50 нам нужно заменить n на 49, а p на 0,50:

0,5\cdot (49+1)=25\quad \color{orange}\bm{\longrightarrow}\color{black}\quad C_{0,50}=250

Итак, квантилем 0,50 будет значение, находящееся на двадцать пятой позиции упорядоченного списка, что соответствует значению 250.

Теперь мы снова применим ту же формулу, чтобы найти квантиль 0,81. Логично, что во втором примере мы должны заменить p на 0,81.

0,81\cdot (49+1)=40,5

Но на этот раз по формуле (40.5) мы получили десятичное число, а это значит, что квантиль будет находиться между позицией 40 и позицией 41. Поэтому для определения этого квантиля нам нужно воспользоваться формулой второго метода:

C=x_i+d\cdot (x_{i+1}-x_i)

В этом случае квантиль будет находиться между позициями 40 и 41, значения которых равны 286 и 289 соответственно. Следовательно, x i равно 286, x i+1 равно 289, а d представляет собой десятичную часть полученного числа, т. е. 0,5.

C_{0,81}=286+0,5\cdot (289-286)=287,5

Как видите, вычисление квантиля зависит от того, дает ли нам первая формула десятичное число. Если вы хотите увидеть больше примеров, вы можете увидеть больше решенных упражнений по различным типам квантилей здесь:

калькулятор квантилей

Введите набор статистических данных и номер квантиля, который вы хотите рассчитать, в калькулятор ниже. Числа должны быть разделены пробелом и введены с использованием точки в качестве десятичного разделителя.

  • квантиль =

Квантили в сгруппированных данных

Чтобы вычислить квантиль, когда данные сгруппированы в интервалы, нам сначала нужно найти интервал или интервал, в который попадает квантиль, используя следующую формулу:

p\cdot (n+1)

Таким образом, квантиль будет находиться в интервале, накопленная абсолютная частота которого сразу больше числа, полученного в предыдущем выражении.

И как только мы узнаем интервал, к которому принадлежит квантиль, мы должны применить следующую формулу, чтобы найти точное значение квантиля:

C=L_i+ \cfrac{p\cdot (n+1)-F_{i-1}}{f_i}\cdot I_i

Золото:

  • Li — нижняя граница интервала, в котором лежит квантиль.
  • n — общее количество наблюдений.
  • F i-1 представляет собой совокупную абсолютную частоту предыдущего интервала.
  • f i — абсолютная частота интервала, в котором лежит квантиль.
  • I i – ширина квантильного интервала.

Чтобы показать вам, как это сделать, приведем конкретный пример расчета квантилей порядка 0,29 и 0,62 для сгруппированных данных.

Чтобы вычислить квантиль 0,29, мы должны сначала найти интервал, в котором он находится. Для этого воспользуемся следующей формулой:

p\cdot (n+1)

0,29\cdot (500+1)=145,29 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [350,375)

Таким образом, квантиль будет находиться в интервале, чья совокупная абсолютная частота сразу превышает 145,29, что в данном случае является интервалом [350,375), чья совокупная абсолютная частота равна 175. И как только мы узнаем интервал квантиля, мы используем формулу второго метод:

C=L_i+ \cfrac{p\cdot (n+1)-F_{i-1}}{f_i}\cdot I_i

C_{0,29}=350+ \cfrac{0,29\cdot (500+1)-131}{44}\cdot 25 =358,12

Теперь мы применим ту же процедуру еще раз, чтобы получить квантиль 0,62. Сначала вычислим интервал, в котором находится квантиль:

0,62\cdot (500+1)=310,62 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [425,450)

Интервал, совокупная абсолютная частота которого сразу превышает 310,62, равен [425,450) с совокупной абсолютной частотой 347. Поэтому мы вычисляем точное значение квантиля, используя вторую формулу в процессе:

C_{0,62}=425+ \cfrac{0,62\cdot (500+1)-298}{49}\cdot 25=431,44

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *