Одне з ключових припущень лінійної регресії полягає в тому, що залишки розподіляються з рівною дисперсією на кожному рівні змінної предиктора. Це припущення відоме як гомоскедастичність . Якщо це припущення не виконується, кажуть, що гетероскедастичність присутня в залишках. Коли це відбувається, результати...
Оцінка Станіна , скорочення від «стандартної оцінки дев’ять», — це спосіб шкалювання результатів тесту за стандартною дев’ятибальною шкалою. Використовуючи цей метод, ми можемо конвертувати кожен результат тесту з початкового балу (тобто від 0 до 100) на число від 1 до 9....
У статистиці децилі — це числа, які ділять набір даних на десять груп однакової частоти. Перший дециль – це точка, де 10% усіх значень даних падають нижче. Другий дециль – це точка, де 20% усіх значень даних падають нижче, і так...
Залишок — це різниця між спостережуваним значенням і прогнозованим значенням у регресійній моделі. Він розраховується таким чином: Залишок = спостережуване значення – прогнозоване значення Один із способів зрозуміти, наскільки регресійна модель відповідає набору даних, — обчислити залишкову суму квадратів , яка...
Залишок — це різниця між спостережуваним значенням і прогнозованим значенням у регресійній моделі. Він розраховується таким чином: Залишок = спостережуване значення – прогнозоване значення Один із способів зрозуміти, наскільки регресійна модель відповідає набору даних, — обчислити залишкову суму квадратів , яка...
Одне з основних припущень лінійної регресії полягає в тому, що залишки мають нормальний розподіл. Один із способів візуально перевірити це припущення — створити гістограму залишків і спостерігати, чи має розподіл «форму дзвона», що нагадує нормальний розподіл . Цей підручник надає покроковий...
Викид — це спостереження , яке аномально віддалено від інших значень у наборі даних. Викиди можуть бути проблематичними, оскільки вони можуть вплинути на результати аналізу. Поширеним способом виявлення викидів у наборі даних є використання інтерквартильного діапазону . Інтерквартильний діапазон, часто скорочено...
У статистиці ми часто зацікавлені у вимірюванні параметрів сукупності , тобто чисел, які описують певні характеристики цілої сукупності. Два найпоширеніші параметри популяції: 1. Середня кількість населення: середнє значення змінної в сукупності (наприклад, середній зріст чоловіків у певному місті) 2. Частка населення:...
Ящичний графік – це тип графіка, який відображає п’ятизначний підсумок набору даних, який включає: Мінімальне значення Перший квартиль (25-й процентиль) Середнє значення Третій квартиль (75-й процентиль) Максимальне значення Щоб зробити прямокутний графік, ми малюємо прямокутник від першого до третього квартиля. Далі...
За наявності двох подій, A і B, «знайти ймовірність A і B» означає знайти ймовірність того, що подія A і B відбудуться . Зазвичай ми записуємо цю ймовірність двома способами: P(A і B) – письмова форма P(A∩B) – Позначення форми Те,...