Мультиколінеарність у регресійному аналізі виникає, коли дві або більше змінних предиктора сильно корельовані одна з одною, так що вони не надають унікальної чи незалежної інформації в моделі регресії. Якщо ступінь кореляції між змінними досить високий, це може спричинити проблеми під час...
Цей підручник містить повний посібник із найкращих тем ggplot2, зокрема: Як змінити зовнішній вигляд сюжетів за допомогою вбудованих тем ggplot2. Як змінити зовнішній вигляд сюжетів за допомогою попередньо визначених тем із бібліотеки ggthemes . Як редагувати певні компоненти теми, зокрема фон...
У цьому посібнику показано приклад виконання множинної лінійної регресії в R, зокрема: Вивчіть дані перед підгонкою моделі Коригування моделі Перевірка припущень моделі Інтерпретація вихідних даних моделі Оцінка відповідності моделі Використовуйте модель для прогнозування Ходімо! Об’єкт Для цього прикладу ми використаємо вбудований...
Відстань Кука , яку часто позначають як D i , використовується в регресійному аналізі для визначення впливових точок даних, які можуть негативно вплинути на вашу модель регресії. Формула відстані Кука: d i = (r i 2 / p*MSE) * (h ii...
Двостороння частотна таблиця — це таблиця, яка відображає частоти (або «підрахунки») для двох категоріальних змінних. Наприклад, наступна двостороння таблиця показує результати опитування 100 людей, який вид спорту вони віддають перевагу: бейсбол, баскетбол чи футбол. У рядках відображається стать респондента, а в...
Багато статистичних тестів (таких як односторонній ANOVA або двосторонній ANOVA ) припускають, що дисперсія між кількома групами однакова. Одним із способів формально перевірити цю гіпотезу є використання тесту Левена , який перевіряє, чи є рівною дисперсія між двома або більше групами....
Діаграма QQ , скорочення від «квантиль-квантиль», — це тип графіка, який ми можемо використовувати, щоб визначити, чи потенційно набір даних походить із теоретичного розподілу. Багато статистичних тестів припускають, що набір даних відповідає нормальному розподілу, і графік QQ часто використовується, щоб оцінити,...
Цей підручник містить просте пояснення того, як інтерпретувати статистику C моделі логістичної регресії. Що таке логістична регресія? Логістична регресія – це статистичний метод, який ми використовуємо для підгонки регресійної моделі, коли змінна відповіді є двійковою. Ось кілька прикладів використання логістичної регресії:...
N-й процентиль набору даних – це значення, яке відсікає перші n відсотків значень даних, коли всі значення відсортовано від найменшого до найбільшого. Наприклад, 90-й процентиль набору даних — це значення, яке відокремлює нижні 90% значень даних від 10% верхніх значень даних....
Т-критерій парних вибірок — це статистичний тест, який порівнює середні значення двох вибірок, коли кожне спостереження з однієї вибірки можна порівняти зі спостереженням з іншої вибірки. Наприклад, скажімо, ми хочемо знати, чи має певна навчальна програма значний вплив на успішність студентів...