Вы можете использовать следующий базовый синтаксис в dplyr для изменения переменной, если столбец содержит определенную строку: library (dplyr) df %>% mutate_at(vars(contains(' starter ')), ~ (scale(.) %>% as. vector )) Этот конкретный синтаксис применяет функцию Scale() к каждой переменной во фрейме данных,...
Гистограмма — это график, который можно использовать для быстрой визуализации распределения значений в наборе данных. В этом руководстве представлен пошаговый пример того, как создать гистограмму в Google Таблицах и изменить количество полей , чтобы гистограмма выглядела именно так, как вы хотите....
Обрезанное среднее значение — это среднее значение набора данных, которое было рассчитано после удаления определенного процента наименьших и наибольших значений в наборе данных. Например, усеченное среднее значение 10 % будет представлять собой среднее значение набора данных после удаления 10 % значений с концов...
Обрезанное среднее значение — это среднее значение набора данных, которое было рассчитано после удаления определенного процента наименьших и наибольших значений в наборе данных. Например, усеченное среднее значение на 10 % будет представлять собой среднее значение набора данных после удаления верхних 10 % значений...
На языке программирования R data.frame является частью базы данных R. Любой data.frame можно преобразовать в data.table с помощью функции setDF пакета data.table . Data.table предлагает следующие преимущества перед data.frame в R: 1. Вы можете использовать функцию fread из пакета data.table для...
В модели линейной регрессии коэффициент регрессии сообщает нам среднее изменение переменной ответа , связанное с увеличением на одну единицу переменной-предиктора. Мы можем использовать следующую формулу для расчета доверительного интервала для коэффициента регрессии: Доверительный интервал для β 1 : b 1 ±...
Часто вам может потребоваться напечатать строку и переменную в одной строке в R. К счастью, это легко сделать с помощью функций print() и Paste0() . В следующем примере показано, как это сделать. Пример. Печать строки и переменной в одной строке в...
Один из наиболее часто используемых алгоритмов кластеризации в машинном обучении известен как кластеризация k-средних . Кластеризация K-средних — это метод, при котором мы помещаем каждое наблюдение из набора данных в один из K- кластеров. Конечная цель состоит в том, чтобы иметь...
Логистическая регрессия — это метод, который мы можем использовать для подбора модели регрессии, когда переменная ответа является двоичной. В следующем пошаговом примере показано, как выполнить логистическую регрессию в Google Sheets. Шаг 1. Установите пакет инструментов анализа XLMiner. Чтобы выполнить логистическую регрессию...
Вы можете использовать следующую формулу, чтобы сложить диапазон длительности в Google Таблицах: = ARRAYFORMULA ( TEXT ( SUM ( IFERROR ( TIMEVALUE ( C2:C8 ) ) ) , " [h]:mm:ss " ) ) Эта конкретная формула суммирует все длительности в диапазоне...