Парный график — это матрица диаграммы рассеяния, которая позволяет понять попарные отношения между различными переменными в наборе данных. К счастью, в R легко создать график пар с помощью функции пары() . В этом руководстве представлено несколько примеров практического использования этой функции....
Биномиальное распределение описывает вероятность получения k успехов в n биномиальных экспериментах. Если случайная величина X имеет биномиальное распределение, то вероятность того, что X = k успеха, можно найти по следующей формуле: P(X=k) = n C k * p k * (1-p)...
Сопутствующая переменная (иногда называемая «ковариатом») — это переменная, которая не представляет основного интереса в исследовании, но которая, тем не менее, может иметь некоторое взаимодействие с изучаемой переменной(ями), представляющей интерес. Неспособность учесть эти типы переменных может привести к предвзятым или вводящим в...
Относительная частота измеряет, как часто определенное значение появляется в наборе данных по отношению к общему количеству значений в наборе данных. Вы можете использовать следующую функцию в Python для расчета относительных частот: def rel_freq (x): freqs = [(value, x.count(value) / len(x)) for...
Доверительный интервал — это диапазон значений, который может содержать параметр совокупности с определенным уровнем достоверности. В этом руководстве объясняется, как построить доверительный интервал для набора данных в R. Пример: построение доверительного интервала в R Предположим, у нас есть следующий набор данных...
Часто при выполнении простой линейной регрессии вам может потребоваться создать диаграмму рассеяния для визуализации различных комбинаций значений x и y, а также предполагаемой линии регрессии. К счастью, в Python есть два простых способа создать график такого типа. В этом руководстве объясняются...
Диаграмма «стебель и лист» — это диаграмма, на которой данные отображаются путем разделения каждого значения в наборе данных на ствол и лист . Это уникальный график, поскольку он помогает нам визуализировать форму распределения при отображении необработанных значений отдельных данных. В этом...
Часто вам может потребоваться расположить строки фрейма данных в R в определенном порядке. К счастью, это легко сделать с помощью функции Arrange() из библиотеки dplyr . В этом руководстве объясняется несколько примеров практического использования этой функции с использованием следующего фрейма данных:...
Часто вас может заинтересовать подсчет количества наблюдений на группу в R. К счастью, это легко сделать с помощью функции count() библиотеки dplyr . В этом руководстве объясняется несколько примеров практического использования этой функции с использованием следующего фрейма данных: #create data frame...
Часто вас может заинтересовать подмножество фрейма данных на основе определенных условий в R. К счастью, это легко сделать с помощью функции filter() из пакета dplyr . library(dplyr) В этом руководстве объясняется несколько примеров практического использования этой функции с использованием встроенного набора...