В статистике z-показатель показывает, сколько стандартных отклонений данное значение имеет от среднего значения генеральной совокупности. Мы используем следующую формулу для расчета z-показателя для заданного значения: z = (x – µ)/σ Золото: x : Значение отдельных данных μ : Среднее число населения...
Ошибка, с которой вы можете столкнуться в R: Error: Discrete value supplied to continuous scale Эта ошибка возникает при попытке применить непрерывный масштаб к оси в ggplot2, если переменная на этой оси не является числовой. В этом руководстве объясняется, как именно...
Вы можете использовать следующий базовый синтаксис для расчета стандартного отклонения столбцов в R: #calculate standard deviation of one column sd(df$col1) #calculate standard deviation of all columns sapply(df, sd) #calculate standard deviation of specific columns sapply(df[c(' col1 ', ' col2 ', '...
Функцию colMeans() в R можно использовать для вычисления среднего значения нескольких столбцов матрицы или фрейма данных в R. Эта функция использует следующий базовый синтаксис: #calculate column means of every column colMeans(df) #calculate column means and exclude NA values colMeans(df, na. rm...
Критерий знаков — это непараметрический тест, используемый для определения того, равна ли совокупность медиане определенному значению. В следующем пошаговом примере показано, как выполнить проверку знаков в Excel. Шаг 1: Введите данные Предположим, завод-производитель заявляет, что производит гаджеты весом 50 фунтов. Чтобы...
В статистике категориальные данные представляют собой данные, которые могут иметь имена или метки. Примеры включают в себя: Статус курения («курящий», «некурящий») Цвет глаз («голубой», «зеленый», «карий») Уровень образования (например, «средняя школа», «степень бакалавра», «степень магистра») Три наиболее часто используемые диаграммы для...
Для группировки переменных в dplyr можно использовать следующий базовый синтаксис: df %>% arrange (group_var, numeric_var) %>% group_by (group_var) %>% mutate (rank = rank(numeric_var)) Следующие примеры показывают, как использовать этот синтаксис на практике со следующим фреймом данных: #create data frame df <-...
Вы можете использовать следующий базовый синтаксис для суммирования столбцов на основе условия в R: #sum values in column 3 where col1 is equal to 'A' sum(df[ which (df$col1==' A '), 3]) Следующие примеры показывают, как использовать этот синтаксис на практике со...
В статистике гамма-распределение часто используется для моделирования вероятностей, связанных со временем ожидания. Мы можем использовать следующие функции для работы с гамма-распределением в R: dgamma(x, shape,rate) – находит значение функции плотности гамма-распределения с определенными параметрами формы и скорости. pgamma(q, shape,rate) – находит...
Биномиальное распределение — это распределение вероятностей, используемое для моделирования вероятности определенного количества «успехов», происходящих в течение фиксированного количества испытаний. Биномиальное распределение целесообразно использовать, если выполняются следующие три предположения: Предположение 1: Каждое испытание имеет только два возможных результата. Мы предполагаем, что каждое...