Диаграмма Парето — это тип диаграммы, в которой используются столбцы для отображения частот отдельных категорий и линия для отображения совокупных частот. В этом руководстве представлен пошаговый пример создания диаграммы Парето в Google Sheets. Шаг 1. Создайте данные Во-первых, давайте создадим фальшивый...
Самый простой способ объединить массивы в Python — использовать функцию numpy.concatenate , которая использует следующий синтаксис: numpy.concatenate((a1, a2,….), ось = 0) Золото: a1, a2…: Последовательность таблиц ось: ось, по которой будут соединены таблицы. Значение по умолчанию — 0. В этом руководстве...
Часто вам может потребоваться сравнить два столбца в DataFrame Pandas и записать результаты сравнения в третий столбец. Вы можете легко сделать это, используя следующий синтаксис: conditions=[(condition1),(condition2)] choices=[" choice1 "," choice2 "] df[" new_column_name "]=np. select (conditions, choices, default) Вот что делает...
Часто вам может потребоваться преобразовать список в DataFrame в Python. К счастью, это легко сделать с помощью функции pandas.DataFrame , которая использует следующий синтаксис: pandas.DataFrame(data=None, index=None, columns=None, …) Золото: data: данные для преобразования в DataFrame. index: индекс, который будет использоваться для...
Межквартильный размах и стандартное отклонение — это два способа измерения распределения значений в наборе данных. В этом руководстве представлено краткое объяснение каждой метрики, а также сходства и различия между ними. Межквартильный размах Межквартильный диапазон (IQR) набора данных — это разница между...
Два термина, которые студенты часто путают в статистике, — это p-значение и альфа . Оба термина используются при проверке гипотез , которые представляют собой формальные статистические тесты, которые мы используем, чтобы отвергнуть или не отвергнуть гипотезу. Например, предположим, что мы предполагаем,...
В таблице непредвиденных обстоятельств предельные средние значения переменной — это средние значения этой переменной, усредненные на каждом уровне другой переменной. Как следует из названия, эти средние значения появляются на полях таблицы непредвиденных обстоятельств. В следующем примере показано, как вычислить предельные средние...
Таблица сопряженности — это тип таблицы, в которой суммируются отношения между двумя категориальными переменными. Чтобы создать таблицу непредвиденных обстоятельств в Python, мы можем использовать функцию pandas.crosstab() , которая использует следующий синтаксис: pandas.crosstab(индекс, столбцы) Золото: индекс: имя переменной, отображаемой в строках таблицы...
Поправка Бонферрони относится к процессу корректировки уровня альфа (α) для семейства статистических тестов с целью контроля вероятности совершения ошибки первого рода. Формула поправки Бонферрони выглядит следующим образом: α новый = α оригинальный / n Золото: исходный α: Исходный уровень α. n:...
Несходство Брея-Кёртиса, названное в честь Дж. Роджера Брея и Джона Томаса Кертиса , представляет собой способ измерения несходства между двумя разными сайтами. Его часто используют в экологии и биологии для количественной оценки разницы между двумя участками с точки зрения видов, обитающих...