logo
Конспект лекций по ТВМС

Лекция 15. Проверка статистических гипотез.

На прошлой лекции мы рассматривали задачу построения доверительных интервалов для неизвестных параметров генеральной совокупности. Сегодня мы продолжим изучение основных задач математической статистики и перейдем к вопросу проверки статистических гипотез.

Проверка статистических гипотез представляет собой важнейший этап процесса принятия решения в управленческой деятельности, позволяя проводить подготовительный этап предстоящих действий с учетом реальных характеристик процесса производства, контроля качества продукции, коммерческой деятельности, и т.п.

Как известно, закон распределения определяет количественные характеристики генеральной совокупности.

Если закон распределения неизвестен, но есть основания предположить, что он имеет определенный вид (например, А), то выдвигают гипотезу: генеральная совокупность распределена по закону А. В этой гипотезе речь идет о виде предполагаемого распределения.

Часто закон распределения известен, но неизвестны его параметры. Если есть основания предположить, что неизвестный параметр равен определенному значению , то может выдвигаться гипотеза . В этой гипотезе речь идет о предполагаемой величине параметра известного распределения.

Возможны и другие гипотезы: о равенстве параметров двух или нескольких распределений, о независимости выборок и т. д.

Приведем несколько задач, которые могут быть решены с помощью проверки статистических гипотез.

1. Используется два метода измерения одной и той же величины. Первый метод дает оценки этой величины, второй - . Требуется определить, обеспечивают ли оба метода одинаковую точность измерений.

2. Контроль точности работы некоторой производственной системы. Получаемые характеристики выпускаемой продукции характеризуются некоторым разбросом (дисперсией). Обычно величина этого разброса не должна превышать некоторого заранее заданного уровня. Требуется определить, обеспечивает ли система (например, линия сборки или отдельный станок) заданную точность.

Итак, статистической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений. Примеры статистических гипотез: генеральная совокупность распределена по закону Пуассона; дисперсии двух нормальных распределений равны между собой.

Наряду с выдвинутой гипотезой всегда рассматривают и противоречащую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то принимается противоречащая гипотеза.

Нулевой (основной) называют выдвинутую гипотезу .

Альтернативной (конкурирующей) называют гипотезу , которая противоречит нулевой. Например, если нулевая гипотеза состоит в предположении, что математическое ожидание нормального распределения равно 5, то альтернативная гипотеза, например, может состоять в предположении, что . Кратко это записывают так: .

Простой называют гипотезу, содержащую только одно предположение. Например, если - параметр показательного распределения, то гипотеза - простая. Сложной называют гипотезу, состоящую из конечного или бесконечного числа простых гипотез. Например, сложная гипотеза состоит из бесконечного множества простых гипотез вида , где - любое число, большее 3.

Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. Так как проверку производят статистическими методами, то ее называют статистической. В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т.е. могут быть допущены ошибки двух родов.

Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Следует отметить, что последствия ошибок могут оказаться различными. Если отвергнуто правильное решение "продолжать строительство жилого дома", то эта ошибка первого рода повлечет материальный ущерб; если же принято неправильное решение "продолжать строительство" несмотря на опасность обвала дома, то эта ошибка второго рода может привести к многочисленным жертвам. Иногда, наоборот, ошибка первого рода влечет более тяжелые последствия.

Естественно, правильное решение может быть принято также в двух случаях, когда принимается правильная гипотеза или отвергается неверная гипотеза.

Вероятность совершения ошибки первого рода называют уровнем значимости и обозначают . Чаще всего уровень значимости принимают равным 0,05 или 0,01. Если, например, принят уровень значимости 0,05, то это означает, что в пяти случаях из ста имеется риск допустить ошибку первого рода (отвергнуть правильную гипотезу).