Рубрика: Гид

Полное руководство по лучшим темам ggplot2

В этом руководстве представлено полное руководство по лучшим темам ggplot2, включая: Как изменить внешний вид графиков с помощью встроенных тем ggplot2. Как изменить внешний вид графиков с помощью предустановленных тем из библиотеки ggthemes . Как редактировать отдельные компоненты темы, включая фон...

Как выполнить множественную линейную регрессию в r

В этом руководстве показан пример выполнения множественной линейной регрессии в R, включая: Изучите данные перед подгонкой модели Настройка модели Проверка предположений модели Интерпретация результатов модели Оценка соответствия модели Используйте модель для прогнозирования Пойдем! Средство В этом примере мы будем использовать встроенный...

Как определить влиятельные точки данных, используя расстояние кука

Расстояние Кука , часто обозначаемое D i , используется в регрессионном анализе для выявления влиятельных точек данных, которые могут отрицательно повлиять на вашу модель регрессии. Формула расстояния Кука: d я = (r я 2 / p*MSE) * (час ii / (1-h...

Как найти условную относительную частоту в двусторонней таблице

Двусторонняя таблица частот — это таблица, в которой отображаются частоты (или «счетчики») для двух категориальных переменных. Например, в следующей двусторонней таблице показаны результаты опроса 100 человек, какой вид спорта они предпочитают: бейсбол, баскетбол или футбол. В строках указан пол респондента, а...

Как выполнить тест левена на равенство дисперсий в r

Многие статистические тесты (например, однофакторный или двусторонний дисперсионный анализ ) предполагают, что дисперсия между несколькими группами одинакова. Один из способов формально проверить эту гипотезу — использовать тест Левена , который проверяет, равна ли дисперсия между двумя или более группами. Этот тест...

Как создать и интерпретировать график qq в r

График QQ , сокращение от «квантиль-квантиль», представляет собой тип графика, который мы можем использовать, чтобы определить, потенциально ли набор данных является результатом теоретического распределения. Многие статистические тесты предполагают, что набор данных соответствует нормальному распределению, и график QQ часто используется для оценки...

Как интерпретировать статистику c модели логистической регрессии

В этом руководстве представлено простое объяснение того, как интерпретировать статистику C модели логистической регрессии. Что такое логистическая регрессия? Логистическая регрессия — это статистический метод, который мы используем для подбора модели регрессии, когда переменная ответа является двоичной. Вот несколько примеров использования логистической...

Как легко рассчитать процентили в r (с примерами)

Энный процентиль набора данных — это значение, которое отсекает первые n процентов значений данных, когда все значения отсортированы от наименьшего к наибольшему. Например, 90-й процентиль набора данных — это значение, которое отделяет нижние 90 % значений данных от верхних 10 %...

Как выполнить t-тест парных выборок в r

T-критерий для парных выборок — это статистический тест, который сравнивает средние значения двух выборок, когда каждое наблюдение из одной выборки может быть сопоставлено с наблюдением из другой выборки. Например, предположим, что мы хотим знать, оказывает ли определенная учебная программа существенное влияние...

Калькулятор ширины класса

В частотном распределении ширина класса означает разницу между верхним и нижним пределами любого класса или категории. Он рассчитывается следующим образом: Ширина класса = (макс – мин)/n Золото: max — максимальное значение в наборе данных min — минимальное значение в наборе данных...