Непараметрична статистика

У цій статті ми пояснюємо, що таке непараметрична статистика та для чого вона використовується. Ви також зможете побачити приклад застосування непараметричної статистики і, крім того, чим відрізняється непараметрична статистика від параметричної.

Що таке непараметрична статистика?

Непараметрична статистика — це галузь інференційної статистики, яка вивчає змінні, які не відповідають розподілу ймовірностей або параметри розподілу яких не визначені. Тобто непараметрична статистика використовується для змінних, які не можна визначити за допомогою теоретичних моделей.

Таким чином, розподіли, які використовуються в непараметричній статистиці, не можуть бути визначені апріорі, а скоріше спостережувані дані визначають їх.

Непараметричні статистичні методи зазвичай використовуються, коли попередні припущення певних тестів не виконуються, оскільки параметрична статистика зазвичай вимагає певних припущень. Нижче ми побачимо, чим відрізняються непараметричні статистики від параметричних.

Таким чином, непараметрична статистика використовується для вивчення популяцій, які мають рейтинг, наприклад огляди фільмів, які отримують від однієї до п’яти зірок. Іншим застосуванням непараметричної статистики є випадки, коли дані мають ранжирування, але не мають чіткої числової інтерпретації, наприклад, під час оцінки переваг.

Приклад непараметричної статистики

Ознайомившись із визначенням непараметричної статистики, ми побачимо приклад її застосування, щоб повністю зрозуміти концепцію.

Уявіть, що у нас є статистична вибірка, що складається з 99 спостережень, і ми хочемо визначити ймовірність значення наступного спостереження (спостереження номер 100).

Якби ми використовували параметричну статистику, ми б спочатку обчислили кілька статистичних параметрів вибірки, щоб дізнатися її характеристики. Потім ми могли б виконати різні статистичні тести, використовуючи обчислені параметри, щоб визначити ймовірність значення наступного спостереження.

Однак завдяки непараметричній статистиці ми можемо знати інформацію про наступне значення без необхідності обчислювати статистичні параметри вибірки.

Наприклад, якщо у нас є вибірка з 99 спостережень, за допомогою непараметричної статистики ми можемо визначити, що існує 1% ймовірності того, що спостереження під номером 100 більше, ніж усі попередні. Таким чином можна провести непараметричну оцінку максимуму вибірки.

Коротше кажучи, за допомогою непараметричної статистики ми можемо обчислювати ймовірності та робити оцінки без необхідності знати статистичні параметри вибірки.

Непараметричні статистичні тести

Непараметричні тести — це статистичні методи, засновані на непараметричній статистиці. Тому в непараметричних тестах змінні оцінюються без припущень щодо розподілу ймовірностей.

Найвідоміші непараметричні тести:

  • тест хі-квадрат
  • біноміальний тест
  • Вілкоксон підписав ранговий тест
  • медіанний тест
  • Тест Андерсона-Дарлінга
  • Тест Кокрена
  • Тест Каппа Коена
  • Тест Фішера
  • Тест Фрідмана
  • Тест Кендаля
  • Тест Колмогорова-Смирнова
  • Тест Койпера
  • Тест Манна-Уітні або тест Вілкоксона
  • Тест МакНемара
  • Тест Зігеля-Тьюкі
  • Знаковий тест
  • Тест Вальда-Вольфовица

Переваги та недоліки непараметричної статистики

Порівняно з параметричною статистикою, переваги та недоліки непараметричної статистики такі:

Перевага:

  • Непараметричну статистику можна застосовувати до числових і нечислових даних.
  • Загалом, непараметричні тести не обов’язково повинні відповідати попереднім припущенням, що дозволяє використовувати їх у більшій кількості ситуацій.
  • Коли розмір вибірки невеликий, непараметричні тести зазвичай застосовуються швидше.

Недоліки:

  • Іноді інформація може бути втрачена, коли дані перетворюються на якісну інформацію.
  • Коли розмір вибірки великий, виконання непараметричного тесту дуже трудомістке.
  • Непараметричні тести, як правило, мають нижчу потужність, тобто необхідний більший розмір вибірки, щоб зробити висновки з таким самим рівнем впевненості.

Непараметрична статистика та параметрична статистика

Нарешті, підсумовуючи, давайте подивимося, яка різниця між непараметричною статистикою та параметричною статистикою.

Параметрична статистика — це галузь інференціальної статистики, яка припускає, що дані можна моделювати за допомогою розподілу ймовірностей. Наприклад, t критерій Стьюдента є параметричним тестом, оскільки він використовує розподіл ймовірностей t Стьюдента.

Різниця між непараметричною статистикою та параметричною статистикою полягає в тому, чи базуються вони на теоретичних моделях. Непараметрична статистика вивчає змінні, які не відповідають розподілу ймовірностей, тоді як параметрична статистика використовує визначені розподіли ймовірностей.

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *