Категорія: Гід

Довгі чи широкі дані: у чому різниця?

Набір даних можна записати в двох різних форматах: широкому та довгому . Широкий формат містить значення, які не повторюються в першому стовпці. Довгий формат містить значення, які повторюються в першому стовпці. Наприклад, розглянемо наступні два набори даних, які містять однакові дані...

Що таке випадки в статистиці? (визначення та приклади)

У статистиці випадки просто стосуються окремих осіб у наборі даних. У більшості наборів даних ми маємо випадки (особи) і змінні (атрибути осіб). Наприклад, наведений нижче набір даних містить 10 випадків і 3 змінні, які ми вимірюємо для кожного випадку: Зверніть увагу,...

Відображення зображення у відтінках сірого в matplotlib (з прикладом)

Ви можете використовувати аргумент cmap у Matplotlib для легкого відображення зображень у відтінках сірого . У наступному прикладі показано, як використовувати цей аргумент на практиці. Приклад: відображення зображення в градаціях сірого в Matplotlib Припустімо, у мене є таке зображення під назвою...

Як виконати тест колмогорова-смирнова в excel

Критерій Колмогорова-Смирнова використовується для визначення того, чи вибірка розподілена нормально чи ні. Цей тест широко використовується, оскільки багато статистичних тестів і процедур припускають , що дані розподілені нормально. У наступному покроковому прикладі показано, як виконати тест Колмогорова-Смирнова на зразку набору даних...

Як використовувати функцію scale() у r (з прикладами)

Функцію scale() в R можна використовувати для масштабування значень у векторі, матриці або кадрі даних. Ця функція використовує такий базовий синтаксис: scale(x, center = TRUE , scale = TRUE ) золото: x : назва об’єкта для масштабування center : чи віднімати...

Як виправити: неможливо виконати "rand_" з масивом типу [int64] і скаляром типу [bool]

Помилка, з якою ви можете зіткнутися в Python: TypeError :Cannot perform 'rand_' with a dtyped [int64] array and scalar of type [bool] Ця помилка зазвичай виникає, коли ви намагаєтеся відфільтрувати pandas DataFrame за допомогою кількох умов, але не можете використовувати круглі...

Як центрувати дані в python: із прикладами

Центрування набору даних означає віднімання середнього значення кожного окремого спостереження в наборі даних. Після центрування набору даних середнє значення набору даних стає нульовим. У наступних прикладах показано, як центрувати дані в Python. Приклад 1: центрування значень масиву NumPy Припустимо, у нас...

Формула спірмена-брауна: визначення та приклад

Формула Спірмена-Брауна використовується для прогнозування надійності тесту після зміни тривалості тесту. Формула: Прогнозована надійність = kr / (1 + (k-1)r) золото: k : Коефіцієнт, за яким змінюється тривалість тесту. Наприклад, якщо вихідний тест містить 10 запитань, а новий — 15 запитань,...

Як використовувати функцію split() у r для розділення даних

Функцію split() у R можна використовувати для розбиття даних на групи на основі рівнів факторів. Ця функція використовує такий базовий синтаксис: розділити (x, f, …) золото: x : ім’я вектора або блоку даних для розділення на групи f : Фактор, який...

Як виконати тест вальда в r

Тест Вальда можна використовувати, щоб перевірити, чи дорівнюють один або кілька параметрів моделі певним значенням. Цей тест часто використовується, щоб визначити, чи дорівнюють нулю одна або кілька змінних предиктора в регресійній моделі . Для цього тесту ми використовуємо такі нульові та...