Рубрика: Гид

Как интерпретировать z-показатели: с примерами

В статистике z-показатель говорит нам, на сколько стандартных отклонений данное значение отличается от среднего . Для расчета z-показателя мы используем следующую формулу: z = (X – µ)/σ Золото: X — одно значение необработанных данных μ — среднее значение σ — стандартное...

Как рассчитать среднюю абсолютную ошибку в python

В статистике средняя абсолютная ошибка (MAE) — это способ измерения точности данной модели. Он рассчитывается следующим образом: MAE = (1/n) * Σ|y i – x i | Золото: Σ: греческий символ, означающий «сумма». y i : наблюдаемое значение для i-го наблюдения....

Какова доля населения?

В статистике доля населения относится к доле особей в популяции с определенной характеристикой. Например, предположим, что 43,8% жителей определенного города поддерживают новый закон. Значение 0,438 представляет долю населения. Формула доли населения Доля населения всегда находится в диапазоне от 0 до 1...

Как найти границы классов: с примерами

В частотном распределении границы классов — это значения, разделяющие классы. Мы используем следующие шаги для расчета границ классов в распределении частот: 1. Вычтите верхний предел первого класса из нижнего предела второго класса. 2. Разделите результат на два. 3. Вычтите результат из...

Что такое стерджес? линейка? (определение & #038; пример)

Гистограмма — это график, который помогает нам визуализировать распределение значений в наборе данных. Оказывается, количество ячеек, используемых в гистограмме, может иметь огромное влияние на то, как мы интерпретируем данные. Если мы используем слишком мало групп, истинная основная закономерность в данных может...

Распределения с перекосом влево или вправо

Асимметрия — это способ описания симметрии распределения. Распределение является перекошенным, если у него есть «хвост» на левой стороне распределения: Распределение является асимметричным вправо , если у него есть «хвост» на правой стороне распределения: А распределение не имеет смещения , если оно...

Как заполнить значения na для нескольких столбцов в pandas

Функция pandas fillna() полезна для заполнения пропущенных значений в столбцах DataFrame pandas. В этом руководстве представлено несколько примеров использования этой функции для заполнения пропущенных значений для нескольких столбцов в следующем DataFrame pandas: import pandas as pd import numpy as np #createDataFrame...

Как выполнить тест тренда манна-кендалла в python

Тест тренда Манна-Кендалла используется для определения наличия тенденции в данных временных рядов. Это непараметрический тест, означающий, что не делается никаких предположений о нормальности данных. Гипотезы проверки следующие: H 0 (нулевая гипотеза): в данных нет тенденции. H A (альтернативная гипотеза): В данных...

Как создать тепловые карты с помощью seaborn (с примерами)

Тепловая карта — это тип диаграммы, в которой для представления значений данных используются разные оттенки цветов. В этом руководстве объясняется, как создавать тепловые карты с использованием библиотеки визуализации Seaborn Python со следующим набором данных: #import seaborn import seaborn as sns #load...

Как создавать гистограммы с помощью seaborn (с примерами)

Гистограмма — это тип диаграммы, на которой отображаются числовые значения различных категориальных переменных. В этом руководстве объясняется, как создавать тепловые карты с помощью библиотеки визуализации Python Seaborn со встроенным набором данных подсказок : import seaborn as sns #load tips dataset data...