Непараметрическая статистика

В этой статье мы объясним, что такое непараметрическая статистика и для чего она используется. Вы также сможете увидеть пример применения непараметрической статистики и, кроме того, чем отличается непараметрическая статистика от параметрической статистики.

Что такое непараметрическая статистика?

Непараметрическая статистика — это раздел статистики, основанной на выводах, который изучает переменные, которые не соответствуют распределению вероятностей или параметры распределения которых не определены. То есть непараметрическая статистика используется для переменных, которые невозможно определить с помощью теоретических моделей.

Таким образом, распределения, используемые в непараметрической статистике, не могут быть определены априори, их определяют наблюдаемые данные.

Непараметрические статистические методы обычно используются, когда предыдущие предположения определенных тестов не выполняются, поскольку параметрическая статистика обычно требует принятия определенных предположений. Ниже мы увидим, каковы различия между непараметрической статистикой и параметрической статистикой.

Таким образом, непараметрическая статистика используется для изучения групп населения, имеющих рейтинг, например обзоры фильмов, которые получают от одной до пяти звезд. Другое применение непараметрической статистики — когда данные имеют рейтинг, но не имеют четкой числовой интерпретации, например, при оценке предпочтений.

Пример непараметрической статистики

Увидев определение непараметрической статистики, мы увидим пример ее применения для полного понимания этой концепции.

Представьте, что у нас есть статистическая выборка, состоящая из 99 наблюдений, и мы хотим определить вероятность значения следующего наблюдения (номер наблюдения 100).

Если бы мы использовали параметрическую статистику, мы бы сначала рассчитали несколько статистических параметров выборки, чтобы узнать ее характеристики. Затем мы могли бы выполнить различные статистические тесты, используя рассчитанные параметры, чтобы определить вероятность значения следующего наблюдения.

Однако благодаря непараметрической статистике мы можем узнать информацию о следующем значении без необходимости рассчитывать статистические параметры выборки.

Например, если у нас есть выборка из 99 наблюдений, с помощью непараметрической статистики мы можем определить, что существует 1% вероятность того, что номер наблюдения 100 больше, чем все предыдущие. Таким образом, можно выполнить непараметрическую оценку максимума выборки.

Короче говоря, с помощью непараметрической статистики мы можем рассчитывать вероятности и делать оценки, не зная статистических параметров выборки.

Непараметрические статистические тесты

Непараметрические тесты — это статистические методы, основанные на непараметрической статистике. Поэтому в непараметрических тестах переменные оцениваются без предположений о распределениях вероятностей.

Наиболее известными непараметрическими тестами являются следующие:

  • тест хи-квадрат
  • биномиальный тест
  • Уилкоксон подписал тест на звание
  • медианный тест
  • Тест Андерсона-Дарлинга
  • тест Кокрена
  • Каппа-тест Коэна
  • тест Фишера
  • тест Фридмана
  • тест Кендалла
  • Тест Колмогорова-Смирнова
  • тест Койпера
  • Тест Манна-Уитни или тест Вилкоксона
  • тест Макнемара
  • Тест Сигела-Тьюки
  • Знаковый тест
  • Тест Вальда – Вольфовица

Преимущества и недостатки непараметрической статистики

По сравнению с параметрической статистикой преимущества и недостатки непараметрической статистики заключаются в следующем:

Преимущество:

  • Непараметрическая статистика может применяться к числовым и нечисловым данным.
  • В общем, непараметрические тесты не обязательно должны соответствовать предварительным предположениям, что позволяет использовать их в большем количестве ситуаций.
  • Когда размер выборки небольшой, непараметрические тесты обычно применяются быстрее.

Недостатки:

  • Иногда информация может быть потеряна, поскольку данные преобразуются в качественную информацию.
  • Когда размер выборки велик, проведение непараметрического теста очень трудоемко.
  • Непараметрические тесты обычно имеют меньшую мощность, а это означает, что для получения выводов с тем же уровнем достоверности необходим больший размер выборки.

Непараметрическая статистика и параметрическая статистика

Наконец, подводя итог, давайте посмотрим, в чем разница между непараметрической статистикой и параметрической статистикой.

Параметрическая статистика — это раздел статистики, основанной на выводах, который предполагает, что данные можно смоделировать с помощью распределения вероятностей. Например, t-критерий Стьюдента является параметрическим тестом, поскольку он использует t-распределение вероятностей Стьюдента.

Разница между непараметрической статистикой и параметрической статистикой заключается в том, основаны ли они на теоретических моделях. Непараметрическая статистика изучает переменные, которые не соответствуют распределениям вероятностей, тогда как параметрическая статистика использует определенные распределения вероятностей.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *