Набір даних можна записати в двох різних форматах: широкому та довгому . Широкий формат містить значення, які не повторюються в першому стовпці. Довгий формат містить значення, які повторюються в першому стовпці. Наприклад, розглянемо наступні два набори даних, які містять однакові дані...
У статистиці випадки просто стосуються окремих осіб у наборі даних. У більшості наборів даних ми маємо випадки (особи) і змінні (атрибути осіб). Наприклад, наведений нижче набір даних містить 10 випадків і 3 змінні, які ми вимірюємо для кожного випадку: Зверніть увагу,...
Ви можете використовувати аргумент cmap у Matplotlib для легкого відображення зображень у відтінках сірого . У наступному прикладі показано, як використовувати цей аргумент на практиці. Приклад: відображення зображення в градаціях сірого в Matplotlib Припустімо, у мене є таке зображення під назвою...
Критерій Колмогорова-Смирнова використовується для визначення того, чи вибірка розподілена нормально чи ні. Цей тест широко використовується, оскільки багато статистичних тестів і процедур припускають , що дані розподілені нормально. У наступному покроковому прикладі показано, як виконати тест Колмогорова-Смирнова на зразку набору даних...
Функцію scale() в R можна використовувати для масштабування значень у векторі, матриці або кадрі даних. Ця функція використовує такий базовий синтаксис: scale(x, center = TRUE , scale = TRUE ) золото: x : назва об’єкта для масштабування center : чи віднімати...
Помилка, з якою ви можете зіткнутися в Python: TypeError :Cannot perform 'rand_' with a dtyped [int64] array and scalar of type [bool] Ця помилка зазвичай виникає, коли ви намагаєтеся відфільтрувати pandas DataFrame за допомогою кількох умов, але не можете використовувати круглі...
Центрування набору даних означає віднімання середнього значення кожного окремого спостереження в наборі даних. Після центрування набору даних середнє значення набору даних стає нульовим. У наступних прикладах показано, як центрувати дані в Python. Приклад 1: центрування значень масиву NumPy Припустимо, у нас...
Формула Спірмена-Брауна використовується для прогнозування надійності тесту після зміни тривалості тесту. Формула: Прогнозована надійність = kr / (1 + (k-1)r) золото: k : Коефіцієнт, за яким змінюється тривалість тесту. Наприклад, якщо вихідний тест містить 10 запитань, а новий — 15 запитань,...
Функцію split() у R можна використовувати для розбиття даних на групи на основі рівнів факторів. Ця функція використовує такий базовий синтаксис: розділити (x, f, …) золото: x : ім’я вектора або блоку даних для розділення на групи f : Фактор, який...
Тест Вальда можна використовувати, щоб перевірити, чи дорівнюють один або кілька параметрів моделі певним значенням. Цей тест часто використовується, щоб визначити, чи дорівнюють нулю одна або кілька змінних предиктора в регресійній моделі . Для цього тесту ми використовуємо такі нульові та...