Как запустить тестер grubbs в excel


Тест Граббса — это статистический тест, который можно использовать для выявления наличия выброса в наборе данных. Чтобы использовать этот тест, набор данных, который вы анализируете, должен быть примерно нормально распределен и в идеале должен содержать не менее 7 наблюдений.

Примечание. Если вы считаете, что в наборе данных есть несколько выбросов, вам следует вместо этого использовать обобщенный тест на экстремальный разрыв в успеваемости для выбросов .

Если вы считаете, что максимальное значение в наборе данных является выбросом, статистика теста рассчитывается следующим образом:

Г = (х максх )/с

Если вы считаете, что минимальное значение в наборе данных является выбросом, статистика теста рассчитывается следующим образом:

G = ( x – x мин ) / с

А если вы не уверены, является ли максимальное или минимальное значение набора данных выбросом, и хотите выполнить двусторонний тест, статистика теста рассчитывается следующим образом:

G знак равно макс|х ях | /с

где x — выборочное среднее значение, а s — выборочное стандартное отклонение.

Критическое значение теста рассчитывается следующим образом:

G критический = (n-1)t критический / √[n(n-2 + t 2 критический )]

где t критический — критическое значение распределения t с n-2 степенями свободы, а уровень значимости — α/n для одностороннего теста и α/(2n) для двустороннего теста.

Пример: тест Граббса в Excel

Определите, является ли значение 60 выбросом в следующем наборе данных:

Шаг 1: Во-первых, нам нужно убедиться, что данные распределены примерно нормально. Для этого мы можем создать гистограмму, чтобы убедиться, что распределение имеет примерно колоколообразную форму. На следующем снимке экрана показано, как создать гистограмму в Excel с помощью пакета инструментов анализа данных :

Из гистограммы мы видим, что данные распределены примерно нормально. Это означает, что мы можем провести тест Граббса.

Гистограмма в Excel

Шаг 2. Далее мы выполним тест Граббса, чтобы определить, действительно ли значение 60 является выбросом в наборе данных. На снимке экрана ниже показаны формулы, которые можно использовать для выполнения теста Граббса:

Тестовая статистика G в ячейке D4 равна 3,603219 .

Критическое значение G Critical в ячейке D11 равно 2,556581 . Поскольку статистика теста превышает критическое значение, это означает, что значение 60 действительно является выбросом в этом наборе данных.

Что делать, если выявлен выброс

Если тест Граббса обнаруживает выброс в вашем наборе данных, у вас есть несколько вариантов:

  • Еще раз проверьте, чтобы убедиться, что значение не является опечаткой или ошибкой ввода данных. Иногда значения, которые появляются как выбросы в наборах данных, являются просто опечатками, допущенными человеком во время ввода данных. Вернитесь назад и убедитесь, что значение было введено правильно, прежде чем принимать дальнейшие решения.
  • Присвойте новое значение выбросу . Если выброс окажется результатом опечатки или ошибки ввода данных, вы можете присвоить ему новое значение, например среднее значение или медиану набора данных.
  • Удалите выброс. Если значение действительно является выбросом, вы можете удалить его, если оно окажет существенное влияние на общий анализ.

Независимо от того, что вы решите сделать с выбросом, обязательно примите его к сведению при представлении окончательных выводов вашего анализа.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *