Середня абсолютна відсоткова помилка (MAPE) зазвичай використовується для вимірювання точності прогнозування моделей. Він розраховується таким чином: MAPE = (1/n) * Σ(|фактичний – прогноз| / |фактичний|) * 100 золото: Σ – символ, що означає «сума» n – розмір вибірки real – фактичне...
Середньоквадратична помилка (MSE) є поширеним способом вимірювання точності передбачення моделі. Він розраховується таким чином: MSE = (1/n) * Σ(фактичний – прогноз) 2 золото: Σ – химерний символ, що означає «сума» n – розмір вибірки real – фактичне значення даних прогноз –...
«Дзвоноподібна крива» — це прізвисько, дане формі нормального розподілу , яка має чітку «дзвонову» форму: Цей підручник пояснює, як створити дзвоноподібну криву в Python. Як створити дзвоноподібну криву в Python Наступний код показує, як створити дзвоноподібну криву за допомогою бібліотек numpy...
У статистиці групування – це процес розміщення числових значень у групи . Найпоширеніша форма кластеризації відома як кластеризація однакової ширини , у якій ми ділимо набір даних на k груп однакової ширини. Менш поширена форма кластеризації відома як рівночастотна кластеризація ,...
Припустімо, у нас є такий набір даних у Python, який відображає кількість продажів, здійснених певним магазином кожного дня тижня протягом п’яти тижнів: import numpy as np import pandas as pd import seaborn as sns #create a dataset np.random.seed(0) data = {'day':...
Популяційна піраміда — це графік, який показує розподіл населення за віком і статтю. Це корисно для розуміння складу населення та тенденції зростання населення. Цей підручник пояснює, як створити наступну піраміду населення в Python: Вікова піраміда в Python Припустімо, що ми маємо...
Індекс подібності Жаккара вимірює подібність між двома наборами даних. Він може варіюватися від 0 до 1. Чим вище число, тим схожішими є два набори даних. Індекс подібності Жаккара розраховується наступним чином: Подібність Жаккара = (кількість спостережень в обох наборах) / (число...
Тест Мак-Немара використовується, щоб визначити, чи існує статистично значуща різниця в пропорціях між парними даними. Цей підручник пояснює, як виконати тест McNemar у Python. Приклад: тест McNemar на Python Скажімо, дослідники хочуть знати, чи може певне маркетингове відео змінити думку людей...
Точний критерій Фішера використовується для визначення того, чи існує значущий зв’язок між двома категоріальними змінними. Зазвичай він використовується як альтернатива тесту хі-квадрат незалежності , коли кількість однієї чи кількох клітинок у таблиці 2 × 2 менше 5. Цей посібник пояснює, як...
Тест відповідності хі-квадрат використовується для визначення того, чи відповідає категоріальна змінна гіпотетичному розподілу. Цей підручник пояснює, як виконати тест відповідності хі-квадрат у Python. Приклад: тест відповідності хі-квадрат у Python Власник магазину каже, що кожен день тижня до його магазину приходить однакова...