Вероятность говорит нам, насколько вероятно, что событие произойдет. Например, предположим, что 4% всех учеников определенной школы предпочитают математику своим любимым предметом. Если мы выберем студента наугад, вероятность того, что он или она отдаст предпочтение математике, составит 4%. Но нас часто интересуют...
Вероятность описывает вероятность наступления события. Мы можем рассчитать вероятности в Excel, используя функцию PROB , которая использует следующий синтаксис: PROB(диапазон_x, диапазон_проб, нижний_предел, [верхний_предел]) Золото: x_range: диапазон числовых значений x. Prob_range: диапазон вероятности, связанный с каждым значением x. нижний_предел: нижний предел значения,...
Распределение Рэлея — это непрерывное распределение вероятностей, используемое для моделирования случайных величин , которые могут принимать только значения, равные или большие нуля. Он имеет следующую функцию плотности вероятности: f(x; σ) = (x/σ 2 )e -x 2 /(2σ 2 ) где σ...
Однофакторный дисперсионный анализ используется для определения того, приводят ли разные уровни объясняющей переменной к статистически различным результатам в определенных переменных отклика . Например, нам может быть интересно понять, приводят ли три уровня образования (степень младшего специалиста, степень бакалавра, степень магистра) к...
Многоступенчатая выборка — это метод получения выборки популяции путем разделения популяции на все более мелкие группы и отбора проб особей из получившихся меньших групп. Например, предположим, что мы хотим оценить средний доход домохозяйства в Соединенных Штатах. Для простоты предположим, что имеется...
Категориальное распределение — это дискретное распределение вероятностей, которое описывает вероятность того, что случайная величина примет значение, принадлежащее одной из K категорий, где каждая категория связана с вероятностью. Чтобы распределение можно было классифицировать как категориальное распределение, оно должно соответствовать следующим критериям: Категории...
Случайная величина подчиняется распределению Бернулли, если она имеет только два возможных результата: 0 или 1. Например, предположим, что мы один раз подбрасываем монету. Пусть п . Это означает, что вероятность выпадения решки равна 1- p . Итак, мы могли бы написать:...
Таблица сопряженности (иногда называемая «перекрестными таблицами») — это тип таблицы, в которой суммируются отношения между двумя категориальными переменными. К счастью, в R легко создать таблицу сопряженности переменных с помощью функции сводной таблицы. В этом уроке показан пример того, как это сделать....
Один из способов количественной оценки связи между двумя переменными – использовать коэффициент корреляции Пирсона , который является мерой линейной связи между двумя переменными . Он всегда принимает значение от -1 до 1, где: -1 указывает на совершенно отрицательную линейную корреляцию между...
Гистограмма полезна для визуализации количества различных категориальных переменных. Иногда нам нужно создать гистограмму, которая визуализирует количество категориальных переменных, разделенных на подгруппы. Например, мы можем захотеть визуализировать общий объем продаж попкорна и газированных напитков на трех разных спортивных стадионах. В этом руководстве...