Рубрика: Гид

Как построить линию регрессии по группам с помощью ggplot2

Мы можем использовать следующий синтаксис для построения линии групповой регрессии с помощью пакета визуализации R ggplot2 : ggplot(df, aes (x = x_variable, y = y_variable, color = group_variable)) + geom_point() + geom_smooth(method = " lm ", fill = NA ) В...

Тест дурбина-ватсона: определение и пример

Одним из основных предположений линейной регрессии является отсутствие корреляции между последовательными остатками . Другими словами, мы предполагаем, что остатки независимы. Когда это предположение нарушается, стандартные ошибки коэффициентов в регрессионной модели, вероятно, будут недооценены, а это означает, что переменные-предикторы с большей вероятностью...

Что такое кластерная дисперсия? (определение & #038; пример)

В статистике кластерная дисперсия просто относится к среднему значению двух или более кластерных дисперсий. Мы используем слово «объединенный», чтобы указать, что мы «объединяем» две или более групповые дисперсии, чтобы получить одно число для общей дисперсии между группами. На практике объединенная дисперсия...

Как winsorize данные: определение и примеры

Винсоризация данных означает установку крайних выбросов, равных указанному процентилю данных. Например, 90%-ная винсоризация устанавливает все наблюдения выше 95-го процентиля равными значению 95-го процентиля, а все наблюдения ниже 5-го процентиля равны значению 5-го процентиля. Действительно, винсоризация данных означает изменение крайних значений набора...

Как винсоризировать данные в excel

Винсоризация данных означает установку крайних выбросов, равных указанному процентилю данных. Например, 90%-ная винсоризация устанавливает все наблюдения выше 95-го процентиля равными значению 95-го процентиля, а все наблюдения ниже 5-го процентиля равны значению 5-го процентиля. В этом руководстве представлен пошаговый пример того, как...

Как создать график с накоплением точек в r

Составная точечная диаграмма — это тип графика, на котором частоты отображаются с помощью точек. Существует два метода, которые вы можете использовать для создания точечного графика в R: Способ 1: функция Stripchart() в базе R. Способ 2: функция geom_dotplot() в ggplot2. В...

Как центрировать данные в r (с примерами)

Центрирование набора данных означает вычитание среднего значения каждого отдельного наблюдения в наборе данных. Например, предположим, что у нас есть следующий набор данных: Оказывается, среднее значение равно 14. Итак, чтобы центрировать этот набор данных, нам нужно вычесть 14 из каждого отдельного наблюдения:...

Как добавить определенные строки в r: с примерами

Мы можем использовать следующий синтаксис для добавления определенных строк фрейма данных в R: with (df, sum (column_1[column_2 == ' some value '])) Этот синтаксис находит сумму строк столбца 1, в которой столбец 2 равен значению, где кадр данных называется df ....

Как написать вложенный оператор if else в r (с примерами)

Функцию ifelse() в базе R можно использовать для написания быстрых операторов if-else. Эта функция использует следующий синтаксис: ifelse(проверка, да, нет) Золото: тест: логический тест да: значение, которое возвращается, если логическая проверка верна. no: значение, возвращаемое, если проверка логики имеет значение False....

Как преобразовать числа в даты в r

Часто вам может потребоваться преобразовать числа в формат даты в R. Самый простой способ сделать это — использовать пакет lubridate , который имеет несколько полезных функций для обработки дат в R. В этом руководстве представлено несколько примеров использования этих функций на...