Как запустить тестер grubbs в excel
Тест Граббса — это статистический тест, который можно использовать для выявления наличия выброса в наборе данных. Чтобы использовать этот тест, набор данных, который вы анализируете, должен быть примерно нормально распределен и в идеале должен содержать не менее 7 наблюдений.
Примечание. Если вы считаете, что в наборе данных есть несколько выбросов, вам следует вместо этого использовать обобщенный тест на экстремальный разрыв в успеваемости для выбросов .
Если вы считаете, что максимальное значение в наборе данных является выбросом, статистика теста рассчитывается следующим образом:
Г = (х макс – х )/с
Если вы считаете, что минимальное значение в наборе данных является выбросом, статистика теста рассчитывается следующим образом:
G = ( x – x мин ) / с
А если вы не уверены, является ли максимальное или минимальное значение набора данных выбросом, и хотите выполнить двусторонний тест, статистика теста рассчитывается следующим образом:
G знак равно макс|х я – х | /с
где x — выборочное среднее значение, а s — выборочное стандартное отклонение.
Критическое значение теста рассчитывается следующим образом:
G критический = (n-1)t критический / √[n(n-2 + t 2 критический )]
где t критический — критическое значение распределения t с n-2 степенями свободы, а уровень значимости — α/n для одностороннего теста и α/(2n) для двустороннего теста.
Пример: тест Граббса в Excel
Определите, является ли значение 60 выбросом в следующем наборе данных:
Шаг 1: Во-первых, нам нужно убедиться, что данные распределены примерно нормально. Для этого мы можем создать гистограмму, чтобы убедиться, что распределение имеет примерно колоколообразную форму. На следующем снимке экрана показано, как создать гистограмму в Excel с помощью пакета инструментов анализа данных :
Из гистограммы мы видим, что данные распределены примерно нормально. Это означает, что мы можем провести тест Граббса.
Шаг 2. Далее мы выполним тест Граббса, чтобы определить, действительно ли значение 60 является выбросом в наборе данных. На снимке экрана ниже показаны формулы, которые можно использовать для выполнения теста Граббса:
Тестовая статистика G в ячейке D4 равна 3,603219 .
Критическое значение G Critical в ячейке D11 равно 2,556581 . Поскольку статистика теста превышает критическое значение, это означает, что значение 60 действительно является выбросом в этом наборе данных.
Что делать, если выявлен выброс
Если тест Граббса обнаруживает выброс в вашем наборе данных, у вас есть несколько вариантов:
- Еще раз проверьте, чтобы убедиться, что значение не является опечаткой или ошибкой ввода данных. Иногда значения, которые появляются как выбросы в наборах данных, являются просто опечатками, допущенными человеком во время ввода данных. Вернитесь назад и убедитесь, что значение было введено правильно, прежде чем принимать дальнейшие решения.
- Присвойте новое значение выбросу . Если выброс окажется результатом опечатки или ошибки ввода данных, вы можете присвоить ему новое значение, например среднее значение или медиану набора данных.
- Удалите выброс. Если значение действительно является выбросом, вы можете удалить его, если оно окажет существенное влияние на общий анализ.
Независимо от того, что вы решите сделать с выбросом, обязательно примите его к сведению при представлении окончательных выводов вашего анализа.