R-квадрат , часто обозначаемый R2 , представляет собой долю дисперсии переменной отклика , которую можно объяснить переменными-предикторами в модели линейной регрессии . Значение R в квадрате может варьироваться от 0 до 1, где: 0 означает, что переменная ответа вообще не может...
Ошибка, с которой вы можете столкнуться при использовании Python: TypeError : unsupported operand type(s) for -: 'str' and 'int' Эта ошибка возникает при попытке выполнить вычитание строковой и числовой переменных. В следующем примере показано, как устранить эту ошибку на практике. Как...
Когда мы подгоняем модели линейной регрессии, мы часто вычисляем значение R-квадрата модели. Значение R-квадрата — это доля дисперсии переменной отклика , которую можно объяснить переменными-предикторами в модели. Значение R в квадрате может варьироваться от 0 до 1, где: Значение 0 указывает,...
Гистограмма предоставляет полезный способ визуализации распределения значений в наборе данных. Ось X гистограммы отображает группы значений данных, а ось Y сообщает нам, сколько наблюдений в наборе данных находится в каждой группе. Поскольку гистограмма помещает наблюдения в ячейки, невозможно вычислить точное стандартное...
В машинном обучении уровень ошибочной классификации — это показатель, который сообщает нам процент наблюдений, которые были неправильно предсказаны моделью классификации . Он рассчитывается следующим образом: Коэффициент ошибочной классификации = количество неверных прогнозов / общее количество прогнозов. Значение коэффициента ошибочной классификации может...
Тестовая гипотеза используется для проверки того, верна ли гипотеза о параметре совокупности . Всякий раз, когда мы выполняем проверку гипотезы, мы всегда определяем нулевую и альтернативную гипотезу: Нулевая гипотеза (H 0 ): данные выборки получены исключительно случайно. Альтернативная гипотеза ( HA...
Одним из наиболее распространенных способов оценки эффективности модели классификации является создание матрицы путаницы, которая суммирует прогнозируемые результаты модели с фактическими результатами набора данных. Два показателя, которые нас часто интересуют в матрице путаницы, — это положительная прогностическая ценность и чувствительность . Положительная...
Ошибка, с которой вы можете столкнуться в R: Error in .Call.graphics(C_palette2, .Call(C_palette2, NULL)): invalid graphics state Эта ошибка может возникнуть по трем причинам: 1. Вы создаете графики в базе R и ggplot2 во время одного сеанса. 2. Ваша версия ggplot2 несовместима...
Функцию readLines() в R можно использовать для чтения всех или части строк текста из объекта соединения. Эта функция использует следующий синтаксис: readLines(con, n=-1L) Золото: недостаток: объект соединения или строка символов n: максимальное количество строк для чтения. По умолчанию читаются все строки....
Функции with() и Inside() в R можно использовать для вычисления выражения на основе фрейма данных. Эти функции используют следующий синтаксис: with(data, expression) within(data, expression) Золото: данные: имя блока данных. выражение: выражение для оценки Вот разница между двумя функциями: with() оценивает выражение,...