logo search
Статистические критерии определения выбросов в непрерывных статистических данных

2.1 Критерий Шовене

Реализуем в статистическом пакете R критерий Шовене, определяющий наличие выбросов в выборке, извлекаемой из нормально распределенной генеральной совокупности. Для этого напишем функцию, которой на входе будем задавать случайную величину, имеющую нормальное распределение, а на выходе будем получать сообщение о том, какая гипотеза принимается.

В переменную запоминаем границу критической области, которая имеет вид . Значение зависит от объема выборки и берется из соответствующих таблиц (см. приложение А). В рассмотренном примере для получаем значение

Статистика, рассматриваемая в этом критерии, определяется формулой (1.1). Статистика проверяет на выброс наименьшее значение вариационного ряда (выборку обязательно нужно упорядочить по возрастанию), а статистика проверяет, соответственно, наибольший элемент вариационного ряда. Для рассмотренной в примере выборки получились следующие значения статистик: Сравнивая полученные значения с критическим, видно, что статистика входит в критическую область, значит, крайний правый элемент выборки признается выбросом и принимается гипотеза .

Таким образом, в данном критерии рассчитываются статистики для крайнего правого и крайнего левого элементов вариационного ряда, и проверяется их попадание в критическую область. Если хотя бы одна статистика попала в критическую область, принимается альтернативная гипотеза о наличии выбросов в выборке, если ни одна не попала - то принимается .