Часто в статистике мы хотим проверить, верна ли гипотеза относительно параметра совокупности . Например, мы могли бы предположить, что средний вес определенной популяции черепах составляет 300 фунтов. Чтобы определить, верна ли эта гипотеза, мы возьмем образец черепах и взвесим каждую. Используя...
Часто вам может потребоваться выбрать строки в DataFrame pandas на основе их значения индекса. Если вы хотите выбирать строки на основе целочисленной индексации, вы можете использовать функцию .iloc . Если вы хотите выбирать строки на основе индексации меток, вы можете использовать...
Часто вам может потребоваться найти максимальное значение для каждой группы в DataFrame pandas. К счастью, это легко сделать с помощью функций groupby() и max() со следующим синтаксисом: df. groupby (' column_name '). max () В этом руководстве объясняется несколько примеров практического...
Проект панели с перекрестной задержкой — это тип модели структурного уравнения, которая измеряет две разные переменные в два момента времени. Например, предположим, что мы измеряем общую сумму, потраченную на образование, и средний доход домохозяйства в определенной стране в два разных момента...
Когда два набора данных имеют одинаковую длину и каждое наблюдение из одного набора данных может быть «сопряжено» с наблюдением из другого набора данных, мы называем это парными данными . Для связи двух наборов данных важно, чтобы каждое наблюдение из одного набора...
Интерполяция — это процесс оценки неизвестного значения функции между двумя известными значениями. Учитывая два известных значения (x 1 , y 1 ) и (x 2 , y 2 ), мы можем оценить значение y для точки x, используя следующую формулу: y...
Часто бывает, что у вас есть одно или несколько пропущенных значений в ряду Excel, который вы хотели бы заполнить. Самый простой способ заполнить недостающие значения — использовать функцию «Заполнить ряд» в разделе «Редактирование» вкладки «Главная» . В этом руководстве представлены два...
Относительное стандартное отклонение — это мера стандартного отклонения выборки от среднего значения выборки для данного набора данных. Он рассчитывается следующим образом: Относительное стандартное отклонение = s/ x * 100% Золото: s: выборочное стандартное отклонение x : выборочное среднее Эта метрика дает...
Тест Уайта используется для определения наличия гетероскедастичности в регрессионной модели. Гетероскедастичность относится к неравномерной дисперсии остатков на разных уровнях переменной отклика в регрессионной модели, что нарушает одно из ключевых предположений линейной регрессии о том, что остатки одинаково разбросаны на каждом уровне...
В статистике наблюдение считается выбросом , если его значение для переменной ответа намного больше, чем у остальных наблюдений в наборе данных. Аналогичным образом, наблюдение считается высоким рычагом воздействия , если оно имеет одно или несколько значений переменных-предсказателей, которые являются гораздо более...