Що таке бета-рівень у статистиці? (визначення & #038; приклад)


У статистиці ми використовуємо перевірку гіпотез , щоб визначити, чи вірна гіпотеза про параметр сукупності .

Перевірка гіпотези завжди має такі дві гіпотези:

Нульова гіпотеза (H 0 ): Дані вибірки узгоджуються з домінуючим переконанням щодо параметра сукупності.

Альтернативна гіпотеза ( HA ): вибіркові дані свідчать про те, що гіпотеза, викладена в нульовій гіпотезі, не відповідає дійсності. Іншими словами, на дані впливає невипадкова причина.

Щоразу, коли ми виконуємо перевірку гіпотези, завжди є чотири можливі результати:

Бета проти Альфа в перевірці гіпотез у статистиці

Є два типи помилок, які ми можемо зробити:

  • Помилка типу I: ми відкидаємо нульову гіпотезу, коли вона насправді вірна. Імовірність здійснення цього типу помилки позначається α .
  • Помилка типу II: ми не можемо відхилити нульову гіпотезу, коли вона насправді хибна. Імовірність такого типу помилки позначається β .

Співвідношення між альфа і бета

В ідеалі дослідники хочуть, щоб імовірність помилки типу I та ймовірність помилки типу II були низькими.

Однак існує компроміс між цими двома ймовірностями. Якщо ми зменшимо альфа-рівень, ми можемо зменшити ймовірність відхилення нульової гіпотези, коли вона насправді вірна, але це фактично збільшить бета-рівень – ймовірність того, що ми не зможемо відхилити нульову гіпотезу, коли вона є неправильною.

Співвідношення між потужністю та бета-версією

Сила перевірки гіпотези стосується ймовірності виявлення ефекту або різниці, коли ефект або різниця насправді присутні. Іншими словами, це ймовірність правильного відхилення хибної нульової гіпотези.

Він розраховується таким чином:

Потужність = 1 – β

Загалом дослідники хочуть, щоб потужність тесту була високою, щоб, якщо є ефект або різниця, тест міг це виявити.

З наведеного вище рівняння ми бачимо, що найкращий спосіб збільшити потужність тесту – це зменшити бета-рівень. І найкращий спосіб зменшити рівень бета-тестування – зазвичай збільшити розмір вибірки.

У наведених нижче прикладах показано, як обчислити бета-рівень перевірки гіпотези, і продемонстровано, чому збільшення розміру вибірки може зменшити бета-рівень.

Приклад 1: обчислення бета-версії для перевірки гіпотези

Припустимо, дослідник хоче перевірити, чи середня вага віджетів, вироблених на фабриці, менше 500 унцій. Ми знаємо, що стандартне відхилення ваг становить 24 унції, і дослідник вирішує зібрати випадкову вибірку з 40 віджетів.

Це реалізує наступну гіпотезу при α = 0,05:

  • H 0 : µ = 500
  • H A : μ < 500

А тепер уявіть, що середня вага виготовлених віджетів фактично становить 490 унцій. Іншими словами, нульову гіпотезу необхідно відкинути.

Ми можемо використати такі кроки, щоб обчислити бета-рівень – ймовірність неспростування нульової гіпотези, коли вона насправді має бути відхилена:

Крок 1. Знайдіть область без відхилення.

Згідно з калькулятором критичного значення Z, ліве критичне значення при α = 0,05 становить -1,645 .

Крок 2: Знайти мінімальний зразок, який ми не зможемо відхилити.

Статистика тесту обчислюється як z = ( x – μ) / (s/ √n )

Отже, ми можемо вирішити це рівняння для вибіркового середнього:

  • x = µ – z*(s/ √n )
  • x = 500 – 1,645*(24/ √40 )
  • х = 493,758

Крок 3: Визначте ймовірність того, що мінімальне середнє значення вибірки дійсно відбудеться.

Ми можемо розрахувати цю ймовірність наступним чином:

  • P(Z ≥ (493,758 – 490) / (24/√ 40 ))
  • P(Z ≥ 0,99)

Відповідно до звичайного калькулятора CDF ймовірність того, що Z ≥ 0,99, дорівнює 0,1611 .

Таким чином, бета-рівень для цього тесту становить β = 0,1611. Це означає, що ймовірність не виявити різницю становить 16,11%, якщо фактичне середнє значення становить 490 унцій.

Приклад 2: обчислення бета-версії для тесту з більшим розміром вибірки

Тепер припустімо, що дослідник виконує точно таку ж перевірку гіпотези, але замість цього використовує вибірку з n = 100 віджетів. Ми можемо повторити ті самі три кроки, щоб обчислити бета-рівень для цього тесту:

Крок 1. Знайдіть область без відхилення.

Згідно з калькулятором критичного значення Z, ліве критичне значення при α = 0,05 становить -1,645 .

Крок 2: Знайти мінімальний зразок, який ми не зможемо відхилити.

Статистика тесту обчислюється як z = ( x – μ) / (s/ √n )

Отже, ми можемо вирішити це рівняння для вибіркового середнього:

  • x = µ – z*(s/ √n )
  • x = 500 – 1,645*(24/√ 100 )
  • х = 496,05

Крок 3: Визначте ймовірність того, що мінімальне середнє значення вибірки дійсно відбудеться.

Ми можемо розрахувати цю ймовірність наступним чином:

  • P(Z ≥ (496,05 – 490) / (24/√ 100 ))
  • P(Z ≥ 2,52)

Відповідно до звичайного калькулятора CDF ймовірність того, що Z ≥ 2,52, дорівнює 0,0059.

Таким чином, бета-рівень для цього тесту становить β = 0,0059. Це означає, що ймовірність не виявити різницю становить лише 0,59%, якщо фактичне середнє значення становить 490 унцій.

Зверніть увагу, що просто збільшивши розмір вибірки з 40 до 100, дослідник зміг знизити бета-рівень з 0,1611 до 0,0059.

Бонус: використовуйте цей калькулятор помилок типу II, щоб автоматично обчислити бета-рівень тесту.

Додаткові ресурси

Вступ до перевірки гіпотез
Як написати нульову гіпотезу (5 прикладів)
Пояснення значень P і статистичної значущості

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *