logo
Статистика

4. О критериях согласия Колмогорова и Смирнова

Часто при проверке гипотез о распределении тех или иных данных недостаточно применить какой-то один критерий, в особенности, когда данные наблюдений не показывают значимого отклонения от гипотезы, и ситуация представляется сомнительной. В этих случаях целесообразно воспользоваться другими критериями, основанными на других вероятностных идеях, чтобы при их помощи подвергнуть анализу те же данные. Таким образом, очень важно иметь широкий арсенал методов для статистической обработки данных.

В настоящем параграфе мы кратко опишем два других эффективных подхода, приводящих к хорошим критериям согласия. Критерий Пирсона, изложенный в  9.2и9.3, может применяться в самой общей ситуации, являясь весьма универсальным. Его применение особенно оправдано в случае выборок из дискретных распределений. Однако для ряда статистических моделей выводы этого критерия могут быть недостаточно эффективными.

Критерии Колмогорова и Смирнова, о которых идет речь ниже, очень широко применяются в случае непрерывныхфункций распределения.

Мы ограничимся лишь рассмотрением случая простой гипотезы

Основой всех методов является рассмотрение некоторой удачно выбранной меры расхождения между выборкой и гипотетическим распределением, а также возможность описать асимптотическое распределение этой меры расхождения при росте объема выборки. В случае критерия Пирсона этой мерой расхождения была функция .

Для критериев КолмогороваиСмирновавыбор меры расхождения связан с эмпирической функцией распределения(см. Определение6.1). А именно, рассматриваетсястатистика Колмогорова

и статистика Смирнова

соответственно. Замечательно то, что эти функции легко могут быть вычислены по выборке (не требуется брать какие-либо интегралы, все сводится к простым выражениям, содержащим конечное суммирование и взятие максимума, см., например, 10.2 в [13]).

Коснемся вопроса об асимптотическом распределении этих функций. По теореме Гливенко (см. (28)) при выполнении гипотезыстатистикастремится к нулю при. Оказывается, что если ее домножить на, то в пределе получится нетривиальное распределение. Более точно, вернатеорема Колмогорова:Если гипотеза верна инепрерывна, то

  1. распределение статистики является одним и тем же для любой функции распределенияи

  2. у последовательности существует предельное распределение при .

Это предельное распределение не совпадает ни с одним упоминавшемся здесь ранее и носит название распределения Колмогорова.

Аналогичное по характеру утверждение имеет место и для статистики Смирнова, а именно, при верной гипотезе и непрерывной

  1. распределение зависит только оти не зависит от,

  2. у последовательности существует предельное распределение при .

Теоремы Колмогорова и Смирнова являются основой для построения соответствующих критериев согласия с критическими множествами вида

и

соответственно. Числа определяются по заданным уровням значимости из таблиц допредельных (или предельных, еслиочень велико) распределений Колмогорова и Смирнова. Сами эти таблицы могут быть взяты, например, из книги [3].