logo search
Статистические критерии определения выбросов в непрерывных статистических данных

Введение

Статистический критерий -- это строгое математическое правило, по которому принимается или отвергается та или иная статистическая гипотеза (как правило, рассматриваются нулевая и альтернативная гипотезы) на известном уровне значимости [1]. Для проверки выполнения гипотезы составляется некоторая статистика. Если значение этой статистики попадает в критическую область, то принимается альтернативная гипотеза, если не попадает - основная.

В практической деятельности важную роль играют статистические критерии, предназначенные для выделения аномальных результатов измерений (выбросов).

Иногда результат одного из серии измерений поразительно расходится со всеми остальными. Когда это происходит, экспериментатор должен решить, является ли такой аномальный результат измерения следствием некоторой ошибки и поэтому должен быть отброшен, или же это законный результат, который должен рассматриваться наряду с другими [2]. Исследованием этого вопроса занимались Диксон, Граббс, также свои подходы развивали Роснер, Гутмен, Смит и многие другие.

Результаты измерений, содержащие грубые ошибки обычно бывают хорошо заметны и могут быть выделены без применения статистических методов. Применение статистических методов выявления грубых ошибок целесообразно лишь в сомнительных случаях, когда информация о качестве измерений либо неполна, либо ненадежна.

Большинство существующих критериев определения выбросов в непрерывных статистических данных опирается на предположение о принадлежности наблюдаемых случайных величин нормальному закону.

Данная курсовая работа состоит из трех глав. В первой главе описываются статистические методы определения выбросов в непрерывных статистических данных, рассматриваются критерии, их статистики, критические области и алгоритмы применения этих критериев. Во второй главе приведено описание процедур и функций рассматриваемых критериев, разработанных в статистическом пакете R. Исследование смоделированных статистик по критериям согласия Колмогорова и Смирнова, проверка асимптотических свойств полученных статистик, проведение сравнения их мощностей и анализ реальных данных с помощью разработанных критериев описаны в третьей главе.