У статистиці асиметрія та ексцес є двома способами вимірювання форми розподілу. Асиметрія – це міра асиметрії розподілу. Це значення може бути позитивним або негативним. Від’ємна асиметрія вказує на те, що хвіст знаходиться на лівій стороні розподілу, який розширюється до більш негативних...
Квартилі – це значення, які ділять набір даних на чотири рівні частини. Перший квартиль представляє 25-й процентиль набору даних. Другий квартиль представляє 50-й процентиль набору даних. Це значення еквівалентне середньому значенню набору даних. Третій квартиль представляє 75-й процентиль набору даних. Ми...
Сфера машинного навчання містить величезний набір алгоритмів, які можна використовувати для розуміння даних. Ці алгоритми можна класифікувати в одну з наступних двох категорій: 1. Алгоритми навчання під наглядом: передбачають створення моделі для оцінки або прогнозування результату на основі одного або кількох...
Ви можете швидко створити нормальний розподіл у Python за допомогою функції numpy.random.normal() , яка використовує такий синтаксис: numpy. random . normal (loc=0.0, scale=1.0, size=None) золото: loc: Середнє значення розподілу. Значення за замовчуванням 0. масштаб: стандартне відхилення розподілу. Значення за умовчанням —...
Алгоритми машинного навчання можна розділити на два типи: контрольовані та неконтрольовані алгоритми навчання . Алгоритми навчання під наглядом можна класифікувати на два типи: 1. Регресія: змінна відповіді є безперервною. Наприклад, змінна відповіді може бути такою: вага Висота Ціна час Всього одиниць...
Щоб оцінити ефективність моделі на наборі даних, нам потрібно виміряти, наскільки прогнози моделі відповідають спостережуваним даним. Для регресійних моделей найбільш часто використовуваним показником є середня квадратична помилка (MSE), яка обчислюється таким чином: MSE = (1/n)*Σ(y i – f(x i )) 2...
Проста лінійна регресія — це техніка, яку ми можемо використати, щоб зрозуміти зв’язок між окремою пояснювальною змінною та окремою змінною відповіді . Коротше кажучи, ця техніка знаходить рядок, який найкраще «відповідає» даним, і має такий вигляд: ŷ = b 0 +...
Проста лінійна регресія — це техніка, яку ми можемо використати, щоб зрозуміти зв’язок між окремою пояснювальною змінною та окремою змінною відповіді . Ця техніка знаходить рядок, який найкраще «відповідає» даним і набуває такої форми: ŷ = b 0 + b 1...
Коли ми хочемо зрозуміти зв’язок між окремою змінною предиктором і змінною відповіді, ми часто використовуємо просту лінійну регресію . Однак, якщо ми хочемо зрозуміти зв’язок між декількома змінними предикторів і змінною відповіді, ми можемо використати множинну лінійну регресію . Якщо у...
Коли ми хочемо зрозуміти зв’язок між однією або декількома змінними предиктора та змінною безперервної відповіді, ми часто використовуємо лінійну регресію . Однак, коли змінна відповіді є категоричною, ми можемо використовувати логістичну регресію . Логістична регресія — це тип алгоритму класифікації ,...