Бардіаграма – це тип діаграми, яка відображає числові значення різних категоріальних змінних. У цьому посібнику пояснюється, як створити теплові карти за допомогою бібліотеки візуалізації Python Seaborn із вбудованим набором даних підказок : import seaborn as sns #load tips dataset data =...
Найпростіший спосіб отримати список унікальних значень у стовпці Pandas DataFrame — це використовувати функцію unique() . Цей підручник містить кілька прикладів використання цієї функції з такими pandas DataFrame: import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A',...
Ви можете використовувати наступний синтаксис, щоб видалити рядки, що містять певний рядок у pandas DataFrame: df[df[" col "]. str . contains (" this string ") == False ] Цей підручник пояснює кілька прикладів практичного використання цього синтаксису з таким DataFrame: import...
Ви можете використовувати такий синтаксис, щоб підсумувати значення стовпця в pandas DataFrame на основі умови: df. loc [df[' col1 '] == some_value , ' col2 ']. sum () У цьому підручнику наведено декілька прикладів практичного використання цього синтаксису з використанням наступних...
Центральна гранична теорема стверджує, що вибірковий розподіл вибіркового середнього є приблизно нормальним, якщо розмір вибірки достатньо великий, навіть якщо розподіл сукупності не є нормальним . Щоб застосувати центральну граничну теорему, мають бути виконані чотири умови: 1. Рандомізація : Дані повинні бути...
Гістограма – це графік, який допомагає нам візуалізувати розподіл значень у наборі даних. Вісь абсцис гістограми відображає групи значень даних, а вісь у говорить нам, скільки спостережень у наборі даних міститься в кожній групі. Хоча гістограми корисні для візуалізації розподілів, не...
Тест хі-квадрат незалежності використовується, щоб визначити, чи існує значний зв’язок між двома категоріальними змінними. Цей тест використовує такі нульові та альтернативні гіпотези: H 0 : (нульова гіпотеза) Дві змінні є незалежними. H 1 : (альтернативна гіпотеза) Ці дві змінні не є...
Упередження верифікації виникає, коли дані дослідження збираються таким чином, що деякі члени сукупності з більшою ймовірністю будуть включені до вибірки, ніж інші. Це може призвести до того, що вибірки не будуть репрезентативними для цільової сукупності , що ускладнить узагальнення результатів вибірки...
Тест Чоу — це статистичний тест, розроблений економістом Грегорі Чоу , який використовується для перевірки рівності коефіцієнтів двох різних регресійних моделей на різних наборах даних. Тест Чоу зазвичай використовується в галузі економетрики з даними часових рядів, щоб визначити, чи існує структурний...
Тест Чоу використовується, щоб перевірити, чи рівні коефіцієнти двох різних регресійних моделей на різних наборах даних. Цей тест зазвичай використовується в галузі економетрики з даними часових рядів, щоб визначити, чи існує структурний розрив у даних у певний момент часу. Цей підручник...