Экономная модель — это модель, которая достигает желаемого уровня соответствия, используя как можно меньше объясняющих переменных . Обоснование модели этого типа проистекает из идеи бритвы Оккама (иногда называемой «принципом экономности»), которая гласит, что самое простое объяснение, вероятно, является правильным. Применительно к...
В статистике мы используем регрессионные модели по двум причинам: (1) Объясните взаимосвязь между одной или несколькими объясняющими переменными и переменной отклика . (2) Прогнозировать значения переменной ответа на основе значений одной или нескольких независимых переменных. Когда наша цель состоит в том,...
Часто в экспериментах исследователи хотят понять взаимосвязь между объясняющей переменной и переменной отклика . К сожалению, в экспериментальных исследованиях часто появляются мешающие переменные , которые влияют на взаимосвязь между объясняющей переменной и переменной отклика, но не представляют интереса для исследователей. Например,...
Часто в экспериментальных исследованиях исследователи просят участников предоставить ответы на несколько различных методов лечения. В исследованиях такого типа эффекты порядка относятся к различиям в ответах участников из-за порядка, в котором им предоставляется лечение. Например, предположим, что исследователи измеряют процент штрафных бросков,...
Ошибка агрегирования возникает, когда ошибочно предполагается, что тенденции, наблюдаемые в агрегированных данных, применимы и к отдельным точкам данных. Самый простой способ понять этот тип предвзятости — взять простой пример. Пример: смещение агрегирования Предположим, исследователи хотят понять взаимосвязь между средним количеством лет...
В статистике исследователи часто хотят понять взаимосвязь между независимой и зависимой переменной. Однако иногда может присутствовать предшествующая переменная . Антецедентная переменная — это переменная, которая появляется перед изучаемыми независимыми и зависимыми переменными и может помочь объяснить взаимосвязь между ними. Вы можете...
В статистике исследователи часто хотят понять взаимосвязь между одной или несколькими объясняющими переменными и переменной отклика . Однако может случиться так, что другие переменные могут повлиять на переменную ответа и не представляют интереса для исследователей. Эти переменные называются ковариатами . Ковариаты:...
ANOVA (дисперсионный анализ) используется для определения наличия или отсутствия статистически значимой разницы между средними значениями трех или более независимых групп. Если p-значение ANOVA ниже определенного выбранного уровня значимости, мы можем отвергнуть нулевую гипотезу и заключить, что у нас есть достаточные доказательства,...
Апостериорный тест — это тип теста, выполняемый после ANOVA , чтобы определить, какие групповые средние значения статистически значимо отличаются друг от друга. Если одна из исследуемых групп считается контрольной , то в качестве апостериорного теста следует использовать тест Даннетта . В...
Часто вам может потребоваться подсчитать только количество строк во фрейме данных R, которое соответствует определенным критериям. К счастью, это легко сделать, используя следующий базовый синтаксис: sum(df$column == value, na.rm= TRUE ) Следующие примеры показывают, как использовать этот синтаксис на практике в...