logo search
Статистические критерии определения выбросов в непрерывных статистических данных

2.4 Критерий Дарлинга

Критерий Дарлинга применяется для любого непрерывного распределения, заданного функцией распределения . Для реализации этого критерия в статистическом пакете R воспользуемся формулами для статистик (1.18) и для критической области (1.19).

Функция - это функция любого непрерывного распределения. Она может быть различной в зависимости от рассматриваемого распределения. В данном примере рассматривается экспоненциальное распределение с параметром . Формируем некоторую выборку , взятую из заданного экспоненциального распределения, строим по этой выборке вариационный ряд и вычисляем статистики для проверки наибольшего и наименьшего значений. Для проверки наибольшего значения вариационного ряда вычисляем статистику , а для наименьшего значения - (в примере ). Критическая область для этих статистик определяется неравенствами (1.19). Находим критические значения статистик . Как видно из полученных значений и , это означает, что оба крайних значения выборки признаются выбросами.

Таким образом, критерий Дарлинга для определения выбросов в выборках является универсальным критерием для любого непрерывного распределения. Для того чтобы задать вид распределения достаточно написать функцию , которая возвращает значение функции распределения в точке .