Рубрика: Гид

Как нормализовать столбцы в dataframe pandas

Часто вам может потребоваться нормализовать значения данных одного или нескольких столбцов в DataFrame pandas. В этом руководстве описаны два способа сделать это: 1. Нормализация Min-Max Цель: Преобразует каждое значение данных в значение от 0 до 1. Формула: Новое значение = (значение...

Как выполнить тест шапиро-уилка на python

Тест Шапиро-Уилка – это тест на нормальность. Он используется для определения того, имеет ли выборка нормальное распределение . Чтобы выполнить тест Шапиро-Уилка в Python, мы можем использовать функцию scipy.stats.shapiro() , которая использует следующий синтаксис: scipy.stats.shapiro(x) Золото: x: таблица образцов данных. Эта...

Как выполнить тест колмогорова-смирнова в python

Критерий Колмогорова-Смирнова используется для проверки того, происходит ли выборка из определенного распределения. Чтобы выполнить тест Колмогорова-Смирнова в Python, мы можем использовать scipy.stats.kstest() для теста с одной выборкой или scipy.stats.ks_2samp() для теста с двумя выборками. В этом руководстве показан пример использования каждой...

Стратифицированная выборка в пандах (с примерами)

Исследователи часто берут образцы из популяции и используют данные выборки, чтобы сделать выводы о популяции в целом. Обычно используемый метод выборки — это стратифицированная случайная выборка , при которой совокупность делится на группы и определенное количество членов из каждой группы случайным...

Matplotlib: как раскрасить диаграмму рассеяния по значению

Часто вам может потребоваться затенить цвет точек на диаграмме рассеяния matplotlib на основе третьей переменной. К счастью, это легко сделать с помощью функции matplotlib.pyplot.scatter() , которая использует следующий синтаксис: matplotlib.pyplot.scatter(x, y, s=Нет, c=Нет, cmap=Нет) Золото: x: Таблица значений, которые будут использоваться...

Как рассчитать rmse в python

Среднеквадратическая ошибка (RMSE) — это показатель, который говорит нам, насколько в среднем далеки наши прогнозируемые значения от наблюдаемых значений в модели. Он рассчитывается следующим образом: RMSE знак равно √[ Σ(P i – O i ) 2 / n ] Золото: Σ...

Как изменить размер шрифта на графике matplotlib

Часто вам может потребоваться изменить размер шрифта различных элементов на графике Matplotlib. К счастью, это легко сделать, используя следующий код: import matplotlib.pyplot as plt plt. rc ('font', size=10) #controls default text size plt. rc ('axes', titlesize=10) #fontsize of the title plt....

Как создать контурный график в matplotlib

Контурный график — это тип графика, который позволяет нам визуализировать трехмерные данные в двух измерениях с помощью контуров. Вы можете создать контурный график в Matplotlib, используя следующие две функции: matplotlib.pyplot.contour() — создает контурные графики. matplotlib.pyplot.contourf() — создает контурные графики с заливкой....

Как удалить галочки с графиков matplotlib

Часто вам может потребоваться удалить деления с одной или нескольких осей на графике Matplotlib. К счастью, это легко сделать с помощью функцииick_params() . В этом руководстве показано несколько примеров того, как использовать эту функцию на практике, на основе следующей диаграммы рассеяния:...

Как создавать графики matplotlib с логарифмическими масштабами

Часто вам может потребоваться создать графики Matplotlib с логарифмическими масштабами для одной или нескольких осей. К счастью, Matplotlib предлагает для этого следующие три функции: Matplotlib.pyplot.semilogx() — создайте график с логарифмическим масштабированием по оси X. Matplotlib.pyplot.semilogy() — создайте график с логарифмическим масштабированием...