logo
Исследование надежности системы

1.2 Методы проверки статистической гипотезы о виде закона распределения

При построении вероятностных моделей приходится делать предположения о законах распределения рассматриваемых случайных величин. Считают, что случайная ошибка измерительного прибора, как правило, хорошо описывается нормальным законом распределения, время безотказной работы устройства - экспоненциальным распределением, число регистрируемых распадов радиоактивного вещества в единицу времени - распределением Пуассона и т.д. Все эти предположения нуждаются в экспериментальной проверке, ее можно провести по результатам серии независимых измерений случайной величины. Эти измерения образуют выборку о1, о2, …, оn из генеральной совокупности, закон распределения которой неизвестен. Требуется проверить гипотезу о том, что функция распределения этой совокупности о1, о2, …, оn есть F(x). Функция F(x), вообще говоря, может зависеть от параметров, оцениваемых по выборке.

Располагая выборкой, мы можем построить выборочную функцию распределения (x). Сравнение (x) с предполагаемой функцией F(x) проводят с помощью специально подобранной статистики - критерия согласия, среди которых чаще всего используются два: Пирсона и Колмогорова.

а) Критерий хи-квадрат К. Пирсона

Использование этого критерия основано на применении такой меры (статистики) расхождения между теоретическим F(x) и эмпирическим распределением Fп(x), которая приближенно подчиняется закону распределения ч2. Гипотеза Н0 о согласованности распределений проверяется путем анализа распределения этой статистики. Применение критерия требует построения статистического ряда.

Итак, пусть выборка представлена статистическим рядом с количеством разрядов ш. Наблюдаемая частота попаданий в i-й разряд ni. В соответствии с теоретическим законом распределения ожидаемая частота попаданий в i-й разряд составляет Fi. Разность между наблюдаемой и ожидаемой частотой составит величину (ni - Fi). Для нахождения общей степени расхождения между F(x) и Fп(x) необходимо подсчитать взвешенную сумму квадратов разностей по всем разрядам статистического ряда:

Величина ч2 при неограниченном увеличении n имеет распределение хи-квадрат (асимптотически распределена как хи-квадрат). Это распределение зависит от числа степеней свободы k, т.е. количества независимых значений слагаемых в выражении. Число степеней свободы равно числу ш минус число линейных связей, наложенных на выборку. Одна связь существует в силу того, что любая частота может быть вычислена по совокупности частот в оставшихся ш - 1 разрядах. Кроме того, если параметры распределения неизвестны заранее, то имеется еще одно ограничение, обусловленное подгонкой распределения к выборке. Если по выборке определяются f параметров распределения, то число степеней свободы составит k=ш- f -1.

Область принятия гипотезы Н0 определяется условием ч2 ч2(k;б), где ч 2(k;б) - критическая точка распределения хи-квадрат с уровнем значимости б, а ч2 ? вычисленное по выборке значение статистики. Вероятность ошибки первого рода равна б, вероятность ошибки второго рода четко определить нельзя, потому что существует бесконечно большое множество различных способов несовпадения распределений.

Мощность критерия зависит от количества разрядов и объема выборки. Критерий рекомендуется применять при n>200, допускается применение при n>40, именно при таких условиях критерий состоятелен (как правило, отвергает неверную нулевую гипотезу).

б) Критерий А.Н. Колмогорова

Для применения критерия А.Н. Колмогорова экспериментальные данные требуется представить в виде вариационного ряда. В качестве меры расхождения между теоретической F(x) и эмпирической Fn(x) функциями распределения непрерывной случайной величины Х используется модуль максимальной разности

dn = max|F(x) - Fn(x)|

А.Н. Колмогоров доказал, что какова бы ни была функция распределения F(x) величины Х при неограниченном увеличении количества наблюдений n функция распределения случайной величины dn асимптотически приближается к функции распределения.

Иначе говоря, критерий А.Н. Колмогорова характеризует вероятность того, что величина dn не будет превосходить параметр l для любой теоретической функции распределения. Уровень значимости a выбирается из условия , в силу предположения, что почти невозможно получить это равенство, когда существует соответствие между функциями F(x) и Fn(x). Критерий А.Н. Колмогорова позволяет проверить согласованность распределений по малым выборкам, он проще критерия хи-квадрат, поэтому его часто применяют на практике. Но требуется учитывать два обстоятельства.

Во-первых, в точном соответствии с условиями его применения необходимо пользоваться следующим соотношением:

Где

Во-вторых, условия применения критерия предусматривают, что теоретическая функция распределения известна полностью (известны вид функции и ее параметры). Но на практике параметры обычно неизвестны и оцениваются по экспериментальным данным. Это приводит к завышению значения вероятности соблюдения нулевой гипотезы, т.е. повышается риск принять в качестве правдоподобной гипотезу, которая плохо согласуется с экспериментальными данными (повышается вероятность совершить ошибку второго рода). В качестве меры противодействия такому выводу следует увеличить уровень значимости a , приняв его равным 0,1 - 0,2, что приведет к уменьшению зоны допустимых отклонений.

Сопоставляя возможности двух критериев, необходимо отметить следующие особенности. Критерий Пирсона устойчив к отдельным случайным ошибкам в экспериментальных данных. Однако его применение требует группирования данных по интервалам, выбор которых относительно произволен и подвержен противоречивым рекомендациям. А критерий Колмогорова слабо чувствителен к виду закона распределения и подвержен влиянию помех в исходной выборке, но прост в применении.

При проверке гипотез о законе распределения следует помнить, что слишком хорошее совпадение с выбранным законом распределения может быть обусловлено некачественным экспериментом или предвзятой предварительной обработкой результатов (некоторые результаты отбрасываются или округляются).

Выбор критерия проверки гипотезы относительно произволен. Разные критерии могут давать различные выводы о справедливости гипотезы, окончательное заключение в таком случае принимается на основе неформальных соображений. Но в нашей курсовой работе мы проверим гипотезу о виде закона распределения с помощью критерия Пирсона.