Часто вам може знадобитися згрупувати та об’єднати кілька стовпців pandas DataFrame. На щастя, це легко зробити за допомогою функцій pandas .groupby() і .agg() . Цей посібник пояснює кілька прикладів практичного використання цих функцій. Приклад 1: згрупуйте за двома стовпцями та знайдіть...
Часто вам може знадобитися нормалізувати значення даних одного або кількох стовпців у pandas DataFrame. Цей підручник пояснює два способи зробити це: 1. Нормування Min-Max Призначення: перетворює кожне значення даних на значення від 0 до 1. Формула: Нове значення = (значення –...
Тест Шапіро-Вілка є тестом нормальності. Він використовується для визначення того, чи походить вибірка з нормального розподілу . Щоб виконати тест Shapiro-Wilk у Python, ми можемо використати функцію scipy.stats.shapiro() , яка використовує такий синтаксис: scipy.stats.shapiro(x) золото: x: таблиця зразків даних. Ця функція...
Тест Колмогорова-Смирнова використовується для перевірки того, чи походить вибірка з певного розподілу. Щоб виконати тест Колмогорова-Смирнова в Python, ми можемо використовувати scipy.stats.kstest() для тесту з одним зразком або scipy.stats.ks_2samp() для тесту з двох зразків. Цей підручник демонструє приклад використання кожної функції...
Дослідники часто беруть зразки з популяції та використовують дані з вибірки, щоб зробити висновки про популяцію в цілому. Зазвичай використовуваним методом вибірки є стратифікована випадкова вибірка , за якої генеральну сукупність поділяють на групи, і певну кількість членів кожної групи випадковим...
Часто вам може знадобитися затінити колір точок у діаграмі розсіювання matplotlib на основі третьої змінної. На щастя, це легко зробити за допомогою функції matplotlib.pyplot.scatter() , яка має такий синтаксис: matplotlib.pyplot.scatter(x, y, s=Немає, c=Немає, cmap=Немає) золото: x: таблиця значень для позицій осі...
Середньоквадратична помилка (RMSE) — це показник, який повідомляє нам, наскільки далекі наші прогнозовані значення в середньому від наших спостережуваних значень у моделі. Він розраховується таким чином: RMSE = √[ Σ(P i – O i ) 2 / n ] золото: Σ...
Часто ви можете змінити розмір шрифту різних елементів на діаграмі Matplotlib. На щастя, це легко зробити за допомогою наступного коду: import matplotlib.pyplot as plt plt. rc ('font', size=10) #controls default text size plt. rc ('axes', titlesize=10) #fontsize of the title plt....
Контурна діаграма — це тип діаграми, який дозволяє візуалізувати тривимірні дані у двох вимірах за допомогою контурів. Ви можете створити контурний графік у Matplotlib за допомогою наступних двох функцій: matplotlib.pyplot.contour() – Створює контурні графіки. matplotlib.pyplot.contourf() – Створює контурні графіки із заливкою....
Часто ви можете видалити галочки з однієї або кількох осей на діаграмі Matplotlib. На щастя, це легко зробити за допомогою функції tick_params() . Цей підручник показує кілька прикладів використання цієї функції на практиці на основі такої діаграми розсіювання: import matplotlib.pyplot as...