Часто в статистиці ми хочемо зібрати дані, щоб ми могли відповісти на певні запитання дослідження. Наприклад, ми можемо захотіти відповісти на такі запитання: 1. Який середній дохід домогосподарства в Цинциннаті, штат Огайо? 2. Яка середня вага певної популяції черепах? 3. Який...
Лінійна регресія – це метод, який ми можемо використати для розуміння зв’язку між однією або декількома змінними предиктора та змінною відповіді . Як правило, коли ми виконуємо лінійну регресію, ми хочемо оцінити середнє значення змінної відповіді. Однак замість цього ми могли...
Лінійна регресія – це метод, який ми можемо використати для розуміння зв’язку між однією або декількома змінними предиктора та змінною відповіді . Як правило, коли ми виконуємо лінійну регресію, ми хочемо оцінити середнє значення змінної відповіді. Однак замість цього ми могли...
Ковзне середнє – це просто середнє значення кількох попередніх періодів у часовому ряду. Щоб обчислити змінне середнє значення одного або кількох стовпців у pandas DataFrame, ми можемо використати такий синтаксис: df[' column_name ']. rolling ( rolling_window ). mean () Цей підручник...
Ви можете відобразити кілька рядків в одній діаграмі Matplotlib за допомогою такого синтаксису: import matplotlib. pyplot as plt plt. plot (df[' column1 ']) plt. plot (df[' column2 ']) plt. plot (df[' column3 ']) ... plt. show () У цьому підручнику наведено...
Дві події є взаємовиключними , якщо вони не можуть відбутися одночасно. Наприклад, припустимо, що подія A — це подія, коли кубик падає на парне число, а подія B — це подія, коли кубик падає на непарне число. Ми б визначили вибірковий...
Дихотомічна змінна — це тип змінної, яка приймає лише два можливі значення. Ось кілька прикладів дихотомічних змінних: Стать: чоловіча або жіноча Підкидання монети: орла або решка Тип нерухомості: Житлова або Комерційна Статус спортсмена: Професіонал або Любитель Результати іспиту: склав або не...
Є два способи створити хмару точок, використовуючи дані з pandas DataFrame: 1. Використовуйте pandas.DataFrame.plot.scatter Один із способів створення діаграми розсіювання — використання вбудованої в pandas функції plot.scatter() : import pandas as pd df. plot . scatter (x = ' x_column_name ',...
Експеримент — це контрольоване наукове дослідження. У статистиці ми часто проводимо експерименти, щоб зрозуміти, як зміна однієї змінної впливає на іншу. Керована змінна – це змінна, яку ми змінюємо або «маніпулюємо», щоб побачити, як ця зміна впливає на іншу змінну. Керовану...
Одне з ключових припущень лінійної регресії полягає в тому, що залишки розподіляються з рівною дисперсією на кожному рівні змінної предиктора. Це припущення відоме як гомоскедастичність . Якщо це припущення не виконується, кажуть, що гетероскедастичність присутня в залишках. Коли це відбувається, результати...