В этом руководстве представлено полное руководство по лучшим темам ggplot2, включая: Как изменить внешний вид графиков с помощью встроенных тем ggplot2. Как изменить внешний вид графиков с помощью предустановленных тем из библиотеки ggthemes . Как редактировать отдельные компоненты темы, включая фон...
В этом руководстве показан пример выполнения множественной линейной регрессии в R, включая: Изучите данные перед подгонкой модели Настройка модели Проверка предположений модели Интерпретация результатов модели Оценка соответствия модели Используйте модель для прогнозирования Пойдем! Средство В этом примере мы будем использовать встроенный...
Расстояние Кука , часто обозначаемое D i , используется в регрессионном анализе для выявления влиятельных точек данных, которые могут отрицательно повлиять на вашу модель регрессии. Формула расстояния Кука: d я = (r я 2 / p*MSE) * (час ii / (1-h...
Двусторонняя таблица частот — это таблица, в которой отображаются частоты (или «счетчики») для двух категориальных переменных. Например, в следующей двусторонней таблице показаны результаты опроса 100 человек, какой вид спорта они предпочитают: бейсбол, баскетбол или футбол. В строках указан пол респондента, а...
Многие статистические тесты (например, однофакторный или двусторонний дисперсионный анализ ) предполагают, что дисперсия между несколькими группами одинакова. Один из способов формально проверить эту гипотезу — использовать тест Левена , который проверяет, равна ли дисперсия между двумя или более группами. Этот тест...
График QQ , сокращение от «квантиль-квантиль», представляет собой тип графика, который мы можем использовать, чтобы определить, потенциально ли набор данных является результатом теоретического распределения. Многие статистические тесты предполагают, что набор данных соответствует нормальному распределению, и график QQ часто используется для оценки...
В этом руководстве представлено простое объяснение того, как интерпретировать статистику C модели логистической регрессии. Что такое логистическая регрессия? Логистическая регрессия — это статистический метод, который мы используем для подбора модели регрессии, когда переменная ответа является двоичной. Вот несколько примеров использования логистической...
Энный процентиль набора данных — это значение, которое отсекает первые n процентов значений данных, когда все значения отсортированы от наименьшего к наибольшему. Например, 90-й процентиль набора данных — это значение, которое отделяет нижние 90 % значений данных от верхних 10 %...
T-критерий для парных выборок — это статистический тест, который сравнивает средние значения двух выборок, когда каждое наблюдение из одной выборки может быть сопоставлено с наблюдением из другой выборки. Например, предположим, что мы хотим знать, оказывает ли определенная учебная программа существенное влияние...
В частотном распределении ширина класса означает разницу между верхним и нижним пределами любого класса или категории. Он рассчитывается следующим образом: Ширина класса = (макс – мин)/n Золото: max — максимальное значение в наборе данных min — минимальное значение в наборе данных...