logo search
Статистические критерии определения выбросов в непрерывных статистических данных

2.2 Критерий Граббса

Для реализации критерии Граббса в пакете R будем использовать формулы для статистик (1.4) - (1.7), (1.10), а для определения критической области будем использовать как готовые таблицы (приложение А), так и аппроксимации (формулы (1.8), (1.9)).

Для начала формируем выборку из нормальной генеральной совокупности объемом . Упорядочиваем эту выборку по возрастанию. Если переменные и равны 0, то будем считать, что м и у2 заранее не известны.

Находим границы . Нижняя граница критической области в зависимости от того, известны параметры распределения м и у2 заранее или нет, может принимать различные значения: - м и у2 заранее не известны, - у2 известно, м не известно, - оба параметра определены. Для сформированной в примере выборки () получили следующие критические значения: При для и используются аппроксимации.

В рассматриваемом примере значения м и у2 не определены, поэтому при расчете статистики попадаем в первое условие, и получаем результат: ="В выборке нет выбросов! (Гипотеза H0)", а в остальных двух условиях переменная равна пустой строке, потому что в эти условия мы не попали. На аномальность проверяются наибольший и наименьший элементы вариационного ряда, т.е. вычисляются статистики и соответственно. В примере - , . Обе статистики не входят в критическую область, поэтому принимается гипотеза .

В случае, когда параметры распределения заданы, то вычисляется статистика по третьему условию:

Для выборки из нормальной генеральной совокупности с параметрами и , получили значение статистики 7631 и . Отсюда следует, что в выборке нет выбросов - .

Таким образом, критерий Граббса позволяет исследовать выборки, извлеченные из нормальных генеральных совокупностей, на наличие аномальных наблюдений и в зависимости от того известны или нет параметры распределения м и у2 вычисляет значения соответствующих статистик и границы критической области.