I Морана — это способ измерения пространственной автокорреляции. Проще говоря, это способ количественной оценки того, насколько близко значения кластеризованы в 2D-пространстве. Он часто используется в географии и географической информатике (ГИС) для измерения того, насколько близко сгруппированы на карте различные объекты, такие...
В статистике верхняя и нижняя границы представляют собой пороговые значения для верхних и нижних выбросов в наборе данных. Они рассчитываются следующим образом: Нижнее закрытие = Q1 – (1,5*IQR) Верхнее закрытие = Q3 + (1,5*IQR) где IQR означает «межквартильный диапазон», который представляет...
Если X — случайная величина , которая подчиняется биномиальному распределению с n испытаниями и p вероятностью успеха для данного испытания, то мы можем вычислить среднее значение (μ ) и стандартное отклонение (σ) для: µ = np σ = √ np(1-p) Оказывается,...
Функция Which() в R возвращает положение элементов логического вектора, имеющих значение TRUE . В этом руководстве представлено несколько примеров практического использования этой функции. Пример 1. Поиск элементов в векторе Следующий код показывает, как найти положение всех элементов вектора, равного 5: #create...
Самый простой способ отсортировать фрейм данных по столбцу в R — использовать функцию order() : #sort ascending df[ order (df$var1), ] #sort descending df[ order (-df$var1), ] В этом руководстве представлено несколько примеров практического использования этой функции со следующим фреймом данных:...
Простая линия линейной регрессии представляет собой линию, которая лучше всего «соответствует» набору данных. В этом руководстве представлен пошаговый пример того, как быстро добавить простую линию линейной регрессии на диаграмму рассеяния в Excel. Шаг 1. Создайте данные Сначала давайте создадим простой набор...
Мы можем использовать функцию Aggregate() в R для получения сводной статистики для одной или нескольких переменных в кадре данных. Эта функция использует следующий базовый синтаксис: агрегат (sum_var ~ group_var, данные = df, FUN = среднее) Золото: sum_var: переменная для суммирования. group_var:...
Корреляция и регрессия — два связанных, но не совсем одинаковых статистических термина. В этом уроке мы дадим краткое объяснение обоих терминов и объясним, чем они похожи и отличаются. Что такое корреляция? Корреляция измеряет линейную связь между двумя переменными, x и y...
Набор событий в совокупности является исчерпывающим , если ожидается, что хотя бы одно из событий произойдет. Например, если мы бросим кубик, то на нем должно выпасть одно из следующих значений: 1 2 3 4 5 6 Таким образом, мы бы сказали,...
Атрибутивный риск – это разница в показателях заболеваемости между людьми, подвергающимися воздействию фактора риска, и людьми, не подвергающимися воздействию этого фактора риска. Например, мы могли бы использовать этот показатель, чтобы понять разницу в сердечно-сосудистых заболеваниях (заболеваемость) между курильщиками (люди, подвергшиеся воздействию)...