645145

Статистический критерий проверки нулевой гипотезы

Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближенное распределение которой известно. Эту величину обозначают через U или Z, если она распределена нормально, F или v²—по закону Фишера – Снедекора, Т – по закону Стьюдента, ² – по закону “хи квадрат” и т. д. Обозначим эту величину в целях общности через К.

Статистическим критерием (или просто критерием) называют случайную величину К, которая служит для проверки нулевой гипотезы.

Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин и таким образом получают частное (наблюдаемое) значение критерия.

Наблюдаемым значением K_набл называют значение критерия, вычисленное по выборкам.

После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другая – при которых она принимается.

Критической областью называют совокупность значении критерия, при которых нулевую гипотезу отвергают.

Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.

Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы – гипотезу принимают.

Поскольку критерий К – одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют.

Критическими точками (границами) k_кр называют точки, отделяющие критическую область от области принятия гипотезы.

Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.

Правосторонней называют критическую область, определяемую неравенством , где положительное число.

Левосторонней называют критическую область, определяемую неравенством где отрицательное число.

Односторонней называют правостороннюю или левостороннюю критическую область.

Двусторонней называют критическую область, определяемую неравенствами , , где .

В частности, если критические точки симметричны относительно нуля, двусторонняя критическая область определяется неравенствами (в предположении, что ): , или равносильным неравенством .

Как найти критическую область? Начнем с нахождения правосторонней критической области. Для отыскания правосторонней критической области достаточно найти критическую точку. Для ее нахождения задаются достаточной малой вероятностью – уровнем значимости . Затем ищут критическую точку исходя из требования, чтобы при условии справедливости нулевой гипотезы вероятность того, что критерий К примет значение, большее была равна принятому уровню значимости: .

Для каждого критерия имеются соответствующие таблицы, по которым и находят критическую точку, удовлетворяющую этому требованию.

Когда критическая точка уже найдена, вычисляют по данным выборок наблюденное значение критерия и, если окажется, что K_набл > k_кр, то нулевую гипотезу отвергают; если же K_набл < k_кр. то нет оснований, чтобы отвергнуть нулевую гипотезу.

Наблюдаемое значение критерия может оказаться большим k_кр не потому, что нулевая гипотеза ложна, а по другим причинам (малый объем выборки, недостатки методики эксперимента и др.). В этом случае, отвергнув правильную нулевую гипотезу, совершают ошибку первого рода. Вероятность этой ошибки равна уровню значимости .

Если нулевая гипотеза принята; ошибочно думать, что тем самым она доказана. Один пример, подтверждающий справедливость некоторого общего утверждения, еще не доказывает его. Поэтому более правильно говорить “данные наблюдений согласуются с нулевой гипотезой и, следовательно, не дают оснований ее отвергнуть”.

На практике для большей уверенности принятия гипотезы ее проверяют другими способами или повторяют эксперимент, увеличив объем выборки.

Отвергают гипотезу более категорично, чем принимают. Достаточно привести один пример, противоречащий некоторому общему утверждению, чтобы это утверждение отвергнуть. Если оказалось, что наблюдаемое значение критерия принадлежит критической области, то этот факт и служит примером, противоречащим нулевой гипотезе, что позволяет ее отклонить.

Отыскание левосторонней и двусторонней критических областей сводится (так же, как и для правосторонней) к нахождению соответствующих критических точек.

Двусторонняя критическая область определяется неравенствами , , где . Критические точки находят исходя из требования, чтобы при справедливости нулевой гипотезы сумма вероятностей что критерий примет значение, меньшее или большее была равна принятому уровню значимости. Ясно, что критические точки могут быть выбраны бесчисленным множеством способов. Если же распределение критерия симметрично относительно нуля и имеются основания (например, для увеличения мощности критерия) выбрать симметричные относительно нуля точки, то . Учитывая, что получим . Это соотношение и служит для отыскания критических точек двусторонней критической области.

Обычно критические точки находят по соответствующим таблицам соответствующих распределений.

Мы строили критическую область, исходя из требования, чтобы вероятность попадания в нее критерия была равна  при условии, что нулевая гипотеза справедлива. Оказывается целесообразным ввести в рассмотрение вероятность попадания критерия в критическую область при условии, что нулевая гипотеза неверна и, следовательно, справедлива конкурирующая.

Мощностью критерия называют вероятность попадания критерия в критическую область при условии, что справедлива конкурирующая гипотеза. Другими словами, мощность критерия есть вероятность того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза.

Пусть для проверки гипотезы принят определенный уровень значимости и выборка имеет фиксированный объем. Остается произвол в выборе критической области. Ее целесообразно построить так, чтобы мощность критерия была максимальной.

Если  – вероятность ошибки второго рода. т. е. события “принята нулевая гипотеза, причем справедлива конкурирующая”, то мощность критерия равна 1–.

Пусть мощность 1– возрастает; следовательно, уменьшается вероятность  совершить ошибку второго рода. Таким образом, чем мощность больше, тем вероятность ошибки второго рода меньше.

Итак, если уровень значимости уже выбран, то критическую область следует строить так, чтобы мощность критерия была максимальной. Выполнение этого требования должно обеспечить минимальную ошибку второго рода, что, конечно, желательно.

Чем меньше вероятности ошибок первого и второго рода, тем критическая область “лучше”. Однако при заданном объеме выборки уменьшить одновременно  и  невозможно; если уменьшить , то  будет возрастать.

Как же выбрать  наиболее целесообразно? Ответ на этот вопрос зависит от “тяжести последствий” ошибок для каждой конкретной задачи. Например, если ошибка первого рода повлечет большие потери, а второго рода—малые, то следует принять возможно меньшее .

Если  уже выбрано, то, пользуясь теоремой Ю. Неймана и Э. Пирсона, можно построить критическую область, для которой  будет минимальным и, следовательно, мощность критерия максимальной.

Единственный способ одновременного уменьшения вероятностей ошибок первого и второго рода состоит в увеличении объема выборок.

Содержание