logo
Konspekt_lektsy

41. Статистические гипотезы

На разных стадиях экономико-статистического исследования часто возникает необходимость формулировки, а затем экспериментальной проверки некоторых предположений или гипотез. Например, при контроле качества продукции во многих ситуациях предполагается, что измеряемые величины нормально распределены вокруг их номинального значения или что применение нового прибора, устройства и т.д. существенно повышает производительность труда. Задача состоит в том, чтобы проверить, не противоречит ли высказанное предположение имеющимся результатам наблюдений.

Понятие «статистическая гипотеза» означает любое предположение о виде или свойствах распределения генеральной совокупности, из которой извлечена выборка. Такие предположения можно делать на основании теоретических соображений или других статистических исследований. Пусть, например, многократно измеряется некоторая физическая величина, точное значение а которой не известно и в процессе измерений не меняется. На результаты измерений влияют многие случайные факторы: точность настройки измерительного прибора, погрешность округления при считывании данных и т.п. Поэтому результат i-го измерения можно записать в виде , где - случайная погрешность измерения. Обычно считают, что общая ошибка складывается из большого числа ошибок, каждая из которых невелика и независима от одна от другой. На основании центральной предельной теоремы можно предположить, что случайные величины имеют нормальное распределение. Такое предположение является статистической гипотезой о виде распределения результатов измерения.

Статистическая гипотеза, являющаяся утверждением о параметрах генеральной совокупности называется параметрической. Гипотеза, содержащая утверждение обо всем распределении изучаемого признака называется непараметрической. Различают также простую и сложную гипотезы. Гипотеза называется простой, если она однозначно определяет распределение исследуемого признака; в противном случае гипотеза называется сложной. Например, простой параметрической гипотезой является утверждение о том, что изучаемый признак Х имеет стандартное нормальное распределение. Если же высказывается предположение, что наблюдаемый признак Х имеет нормальное распределение, не указывая при этом конкретное значение среднего и дисперсии или указывая значение только одного параметра, то это сложная гипотеза.

Процедура обоснования сопоставления высказанной статистической гипотезы с имеющимися в нашем распоряжении выборочными данными называется проверкой статистической гипотезы. Результат подобного сопоставления может быть либо отрицательным, либо неотрицательным. В первом случае данные наблюдения противоречат высказанной гипотезе, а потому от этой гипотезы следует отказаться, во втором – данные наблюдений не противоречат высказанной гипотезе, следовательно, ее можно принять в качестве одного из допустимых предположений. При этом неотрицательный результат проверки гипотезы не означает, что высказанное нами предположение является единственно верным, – просто оно не противоречит имеющимся выборочным данным. Однако таким же свойством наряду с проверяемой гипотезой могут обладать и другие гипотезы. Так что даже статистически проверенное предположение следует расценивать не как раз и навсегда установленный факт, а как достаточно правдоподобное, не противоречащее имеющимся данным утверждение.

Проверяемая гипотеза называется основной или нулевой и обозначается . Гипотеза, которая противопоставляется нулевой, называется альтернативной или конкурирующей и обозначается . В качестве конкурирующей часто выступает гипотеза, противоположная основной. Кроме того, альтернативных гипотез может быть несколько или бесконечно много.

Например, рассмотрим нулевую гипотезу : параметр принимает значение, равное , т.е. . В качестве альтернативной можно рассмотреть одну из следующих гипотез: а) : ; б) : ; в) : .

Проверка статистических гипотез на основании выборочных данных неизбежно связана с риском принятия ложного решения. При этом возможны два ошибочных решения:

Возможные результаты статистической проверки представлены ниже в таблице:

Результаты проверки гипотезы

Возможные состояния гипотезы

Гипотеза Н0 верна

Гипотеза Н0 неверна

Гипотеза Н0 отвергается

Ошибка 1-го рода

Правильный вывод

Гипотеза Н0 принимается

Правильный вывод

Ошибка 2-го рода

Последствия указанных ошибок часто оказываются различными. Например, если основная гипотеза состоит в признании продукции предприятия качественной и допущена ошибка 1-го рода, то будет забракована годная продукция. Допустив ошибку 2-го рода, производитель отправляет потребителю брак. В данном случае последствия второй ошибки более серьезны с точки зрения имиджа фирмы и ее долгосрочных перспектив. Если основная гипотеза состоит в наличии некоторого заболевания у пациента, то ошибка 2-го рода приведет к неправильному заключению о необходимости лечения. В результате ошибки 1-го рода имеющееся заболевание не будет обнаружено, что может привести к летальному исходу.

Исключить ошибки первого и второго рода во многих случаях невозможно в силу ограниченности выборки. Поэтому стремятся минимизировать потери от этих ошибок. Одновременное уменьшение вероятностей данных ошибок при фиксированном объеме выборки невозможно, так как задачи их уменьшения являются конкурирующими, и снижение вероятности допустить одну из них влечет за собой увеличение вероятности допустить другую. В большинстве случаев единственный способ уменьшения вероятности ошибок состоит в увеличении объема выборки.