В статистике z-показатель говорит нам, на сколько стандартных отклонений данное значение отличается от среднего . Для расчета z-показателя мы используем следующую формулу: z = (X – µ)/σ Золото: X — одно значение необработанных данных μ — среднее значение σ — стандартное...
В статистике средняя абсолютная ошибка (MAE) — это способ измерения точности данной модели. Он рассчитывается следующим образом: MAE = (1/n) * Σ|y i – x i | Золото: Σ: греческий символ, означающий «сумма». y i : наблюдаемое значение для i-го наблюдения....
В статистике доля населения относится к доле особей в популяции с определенной характеристикой. Например, предположим, что 43,8% жителей определенного города поддерживают новый закон. Значение 0,438 представляет долю населения. Формула доли населения Доля населения всегда находится в диапазоне от 0 до 1...
В частотном распределении границы классов — это значения, разделяющие классы. Мы используем следующие шаги для расчета границ классов в распределении частот: 1. Вычтите верхний предел первого класса из нижнего предела второго класса. 2. Разделите результат на два. 3. Вычтите результат из...
Гистограмма — это график, который помогает нам визуализировать распределение значений в наборе данных. Оказывается, количество ячеек, используемых в гистограмме, может иметь огромное влияние на то, как мы интерпретируем данные. Если мы используем слишком мало групп, истинная основная закономерность в данных может...
Асимметрия — это способ описания симметрии распределения. Распределение является перекошенным, если у него есть «хвост» на левой стороне распределения: Распределение является асимметричным вправо , если у него есть «хвост» на правой стороне распределения: А распределение не имеет смещения , если оно...
Функция pandas fillna() полезна для заполнения пропущенных значений в столбцах DataFrame pandas. В этом руководстве представлено несколько примеров использования этой функции для заполнения пропущенных значений для нескольких столбцов в следующем DataFrame pandas: import pandas as pd import numpy as np #createDataFrame...
Тест тренда Манна-Кендалла используется для определения наличия тенденции в данных временных рядов. Это непараметрический тест, означающий, что не делается никаких предположений о нормальности данных. Гипотезы проверки следующие: H 0 (нулевая гипотеза): в данных нет тенденции. H A (альтернативная гипотеза): В данных...
Тепловая карта — это тип диаграммы, в которой для представления значений данных используются разные оттенки цветов. В этом руководстве объясняется, как создавать тепловые карты с использованием библиотеки визуализации Seaborn Python со следующим набором данных: #import seaborn import seaborn as sns #load...
Гистограмма — это тип диаграммы, на которой отображаются числовые значения различных категориальных переменных. В этом руководстве объясняется, как создавать тепловые карты с помощью библиотеки визуализации Python Seaborn со встроенным набором данных подсказок : import seaborn as sns #load tips dataset data...