Рубрика: Гид

Как рассчитать доверительный интервал для относительного риска

Относительный риск часто рассчитывается при анализе таблицы 2×2, которая имеет следующий формат: Относительный риск говорит нам о вероятности возникновения события в экспериментальной группе по сравнению с вероятностью события в контрольной группе. Он рассчитывается следующим образом: Относительный риск = [A/(A+B)] / [C/(C+D)]...

Является ли возраст интервалом или переменной величиной? (объяснение и пример)

В статистике все переменные измеряются по одной из четырех шкал измерения: Номинальные : переменные, не имеющие количественных значений. Порядковые : переменные, которые имеют естественный порядок, но не имеют количественной разницы между значениями. Интервал : переменные, которые имеют естественный порядок и измеримую...

Выборочная дисперсия по сравнению с дисперсия населения: в чем разница?

Дисперсия — это способ измерения распределения значений в наборе данных. Формула для расчета дисперсии генеральной совокупности : σ 2 = Σ (x i – µ) 2 / N Золото: Σ : Символ, означающий «сумма». μ : Среднее число населения x i...

Гипотеза постоянной дисперсии: определение и пример

Линейная регрессия — это метод, который мы используем для количественной оценки взаимосвязи между одной или несколькими переменными-предикторами и переменной отклика . Одним из ключевых предположений линейной регрессии является то, что остатки имеют постоянную дисперсию на каждом уровне предикторной переменной (переменных). Если...

Полное руководство: как сообщить о коэффициентах шансов

В статистике отношение шансов показывает нам отношение шансов события, произошедшего в экспериментальной группе, к шансам события, произошедшего в контрольной группе. Когда мы сообщаем об отношении шансов, мы обычно включаем следующее: Значение отношения шансов Доверительный интервал для отношения шансов Как интерпретировать отношение...

Полное руководство: как сообщить о результатах логистической регрессии

Логистическая регрессия — это тип регрессионного анализа, который мы используем, когда переменная ответа является двоичной. Мы можем использовать следующий общий формат для сообщения о результатах модели логистической регрессии: Логистическая регрессия использовалась для анализа взаимосвязи между [переменной-предиктором 1], [переменной-предиктором 2],… [переменной-предиктором n...

Когда следует использовать полиномиальную регрессию?

Полиномиальная регрессия — это метод, который мы можем использовать для подбора модели регрессии, когда связь между переменными-предикторами и переменной ответа является нелинейной. Модель полиномиальной регрессии принимает следующую форму: Y = β 0 + β 1 X + β 2 X 2...

Что такое концептуальная переменная? (определение и примеры)

В статистике концептуальная переменная представляет собой конструкцию или абстрактную сущность, которую мы хотим измерить. Однако мы не можем напрямую измерить концептуальную переменную, поэтому вместо этого мы используем фактическое измерение для количественной оценки концептуальной переменной. Например, предположим, что исследователь хочет оценить «общее...

Как исправить: можно сравнивать только серийные объекты с одинаковой маркировкой.

Ошибка, с которой вы можете столкнуться при использовании панд: ValueError : Can only compare identically-labeled DataFrame objects Эта ошибка возникает, когда вы пытаетесь сравнить два DataFrames pandas, а метки индексов или метки столбцов не совпадают полностью. В следующем примере показано, как...

Как исправить: длина значений не соответствует длине индекса

Ошибка, с которой вы можете столкнуться при использовании панд: ValueError: Length of values does not match length of index Эта ошибка возникает, когда вы пытаетесь присвоить массив значений NumPy новому столбцу в DataFrame pandas, но длина массива не соответствует текущей длине...