Процентили (статистика)

В этой статье объясняется, что такое процентиль и как он рассчитывается. Вы найдете решенные упражнения с процентилями и, кроме того, сможете вычислить любой процентиль вашей выборки данных с помощью онлайн-калькулятора.

Что такое процентили?

В статистике процентили — это значения, делящие набор упорядоченных данных на сто равных частей. Итак, процентиль указывает значение, ниже которого падает процент набора данных.

Например, значение 35-го процентиля выше, чем у 35% наблюдаемых данных, но ниже, чем у остальных данных.

Процентили обозначаются заглавной буквой P и индексом процентиля, то есть 1-й процентиль — P 1 , 40-й процентиль — P 40 , 79-й процентиль — P 79 и так далее.

процентили

👉 Вы можете использовать калькулятор ниже, чтобы рассчитать процентили любого набора данных.

Точно так же процентили являются мерой нецентрального положения наряду с квартилями, квинтилями и децилями. Вы можете проверить значение каждого из этих типов квантилей на нашем сайте.

Следует отметить, что термин процентили также используется для сравнения веса и роста ребенка со стандартными значениями других малышей, поскольку существуют таблицы роста с записанными значениями, которые помогают определить, правильно ли растет ребенок или нет. . .

Как посчитать процентили

Чтобы вычислить положение процентиля ряда статистических данных, необходимо умножить число процентилей на сумму общего количества точек данных плюс один и разделить результат на сто.

Таким образом, формула процентиля выглядит следующим образом:

\cfrac{k\cdot (n+1)}{100} \qquad k=1, 2, 3,\ldots ,97,98,99

Обратите внимание: эта формула сообщает нам положение процентиля, но не его значение. Процентилем будут данные, расположенные в позиции, полученной по формуле.

Однако иногда результат этой формулы дает нам десятичное число, поэтому мы должны различать два случая в зависимости от того, является ли результат десятичным числом или нет:

  • Если результатом формулы является число без десятичной части , процентиль соответствует данным, которые находятся в позиции, указанной формулой выше.
  • Если результатом формулы является число с десятичной частью , точное значение процентиля рассчитывается по следующей формуле:

P=x_i+d\cdot (x_{i+1}-x_i)

Где x i и x i+1 — номера позиций, между которыми находится число, полученное по первой формуле, а d — десятичная часть числа, полученного по первой формуле.

Теперь вы можете подумать, что найти процентили статистической выборки или совокупности сложно, поскольку метод включает в себя множество шагов, но на самом деле это просто. Прочтите следующие два конкретных примера, и я уверен, вы поймете это намного лучше.

Примечание . Научное сообщество еще не пришло к единому мнению о том, как рассчитывать процентили, поэтому вы можете найти книгу по статистике, в которой это объясняется немного по-другому.

Примеры расчета процентилей

Как вы видели выше в объяснении того, как найти процентили выборки, расчет варьируется в зависимости от того, является ли результат первой формулы десятичным или нет. Поэтому ниже вы найдете два решенных примера, по одному на каждый случай.

Пример 1

  • По данным, приведенным в следующей таблице, рассчитайте 1-й, 43-й и 89-й процентили.

Как объяснялось в предыдущем разделе, формула для определения положения процентиля выглядит следующим образом:

\cfrac{k\cdot (n+1)}{100} \qquad k=1, 2, 3,\ldots ,97,98,99

В этом случае размер выборки для этого упражнения составляет 999 статистических данных, поэтому для расчета положения первого процентиля нам нужно заменить 999 на n и 1 на k :

\cfrac{1\cdot (999+1)}{100}=10\quad \color{orange}\bm{\longrightarrow}\color{black}\quad P_1=35

Таким образом, 1-й процентиль будет тем, чья совокупная абсолютная частота сразу превышает 10, что в данном случае равно 35, поскольку его совокупная абсолютная частота равна 53.

Чтобы определить 43-й процентиль, вы должны использовать ту же формулу, но, очевидно, на этот раз мы заменим k на 43.

\cfrac{43\cdot (999+1)}{100}=430\quad \color{orange}\bm{\longrightarrow}\color{black}\quad P_{43}=39

Абсолютная совокупная частота непосредственно выше 430 равна 431 из данных 39, поэтому 43-й процентиль равен 39.

Наконец, мы применяем ту же формулу для получения 89-го процентиля:

\cfrac{89\cdot (999+1)}{100}=890\quad \color{orange}\bm{\longrightarrow}\color{black}\quad P_{89}=44

Совокупная абсолютная частота значения 44 равна 948, что сразу больше, чем 890. Следовательно, 89-й процентиль равен 44.

Пример 2

  • Найдите 35-й и 67-й процентили следующего ряда данных:

Даже если в этом упражнении нам придется выполнить больше вычислений, принцип все тот же: мы должны вычислить положение процентиля с помощью следующего выражения.

\cfrac{k\cdot (n+1)}{10} \qquad k=1, 2, 3,\ldots ,97,98,99

Таким образом, для расчета 35-го процентиля мы заменяем k на 35, а n на общее количество данных, т. е. 700:

\cfrac{35\cdot (700+1)}{100}=245,35

Но на этот раз мы получили из формулы десятичное число, поэтому нам нужно применить следующее алгебраическое выражение для расчета точного значения процентиля:

P=x_i+d\cdot (x_{i+1}-x_i)

Число, заданное первой формулой, равно 245,35, поэтому 35-й процентиль находится между позициями 245 и 246, что соответствует значениям 29 и 29 соответственно. Следовательно, x i равно 29, x i+1 равно 29, а d равно десятичной части полученного числа, т. е. 0,35.

P_{35}=29+0,35\cdot (29-29)=29

Чтобы найти 67-й процентиль, нам нужно использовать тот же метод. Сначала мы вычисляем процентильную позицию:

\cfrac{67\cdot (700+1)}{100}=469,67

Полученное число 469,67 указывает на то, что процентиль будет находиться между позициями 469 и 470, значения которых равны 31 и 32. Поэтому в процессе работы мы используем вторую формулу, чтобы найти точное значение процентиля:

P_{67}=31+0,67\cdot (32-31)=31,67

процентиль калькулятор

Введите набор статистических данных и процентиль, который вы хотите рассчитать, в следующий калькулятор. Данные должны быть разделены пробелом и введены с использованием точки в качестве десятичного разделителя.

  • процентиль =

Процентили в сгруппированных данных

Чтобы рассчитать процентили, когда данные сгруппированы в группы , нам сначала нужно найти группу или класс, к которому относится процентиль, используя следующую формулу:

\cfrac{k\cdot (n+1)}{100} \qquad k=1, 2, 3,\ldots ,97,98,99

Таким образом, процентиль будет находиться в интервале, абсолютная частота которого сразу больше числа, полученного в предыдущем выражении.

И как только мы уже знаем интервал, к которому принадлежит процентиль, мы должны применить следующую формулу, чтобы найти точное значение процентиля:

P_k=L_i+\cfrac{\displaystyle\frac{k\cdot (n+1)}{100}-F_{i-1}}{f_i}\cdot I_i \qquad k=1,2,3,\ldots ,97,98,99

Золото:

  • Li — нижняя граница интервала, в котором лежит процентиль.
  • n — общее количество наблюдений.
  • F i-1 представляет собой совокупную абсолютную частоту предыдущего интервала.
  • f i — абсолютная частота интервала, в котором лежит процентиль.
  • I i — ширина процентильного интервала.

Ниже приведено пошаговое упражнение по получению процентилей, когда данные выражены в интервалах. В частности, рассчитываются 29-й, 52-й и 98-й процентили.

Данные в этой выборке сгруппированы как интервалы, поэтому для определения процентилей нам нужно выполнить два шага: сначала нам нужно найти интервал, в который попадает процентиль, а затем применить формулу для расчета точного значения процентиля. процентиль.

Таким образом, мы находим положение 29-го процентиля с помощью следующего выражения:

\cfrac{k\cdot (n+1)}{100}

\cfrac{29\cdot (500+1)}{100} =145,29 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [350,375)

Процентильным интервалом будет тот, чья совокупная абсолютная частота сразу превышает 145,29, что в данном случае представляет собой интервал [350,375), чья совокупная абсолютная частота равна 175. И как только мы узнаем процентильный интервал, мы применим следующую формулу для его расчета. точное значение:

P_k=L_i+\cfrac{\displaystyle\frac{k\cdot (n+1)}{100}-F_{i-1}}{f_i}\cdot I_i

P_{29}=350+\cfrac{\displaystyle\frac{29\cdot (500+1)}{100}-131}{44}\cdot 25=358,12

Теперь мы повторяем ту же процедуру для расчета 52-го процентиля. Сначала вычислим его интервал:

\cfrac{52\cdot (500+1)}{100} =260,52 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [400,425)

Интервал 52-го процентиля равен [400,425), поскольку его совокупная абсолютная частота (298) находится непосредственно над 260,52. Таким образом, точное значение процентиля будет:

P_{52}=400+\cfrac{\displaystyle\frac{52\cdot (500+1)}{100}-234}{64}\cdot 25=410,36

Наконец, мы найдем 98-й процентиль. Как всегда, сначала вычисляем интервал, в котором он лежит:

\cfrac{98\cdot (500+1)}{100} =490,98 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [475,500)

И как только мы узнаем интервал, в котором находится процентиль, мы рассчитаем его точное значение по следующей формуле:

P_{98}=475+\cfrac{\displaystyle\frac{98\cdot (500+1)}{100}-442}{58}\cdot 25=496,11

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *