Статистическая проверка статистических гипотез.
Часто необходимо знать закон распределения генеральной совокупности. Если закон распределения неизвестен, но имеются основания предположить, что он имеет определенный вид (назовем его А), выдвигают гипотезу: генеральная совокупность распределена по закону А. Таким образом, в этой гипотезе речь идет о виде предполагаемого распределения.
Возможен случай, когда закон распределения известен, а его параметры неизвестны. Если есть основания предположить, что неизвестный параметр равен определенному значению , выдвигают гипотезу: = . Таким образом, в этой гипотезе речь идет о предполагаемой величине параметра одного известного распределения.
Возможны и другие гипотезы: о равенстве параметров двух или нескольких распределений, о независимости выборок и многие другие.
Статистической называют гипотезу о виде неизвестного распределения, или о параметрах известных распределений.
Например, статистическими являются гипотезы:
генеральная совокупность распределена по закону Пуассона;
дисперсии двух нормальных совокупностей равны между собой.
В первой гипотезе сделано предположение о виде неизвестного распределения, во второй —о параметрах двух известных распределений.
Гипотеза «на Марсе есть жизнь» не является статистической, поскольку в ней не идет речь ни о виде, ни о параметрах распределения.
Наряду с выдвинутой гипотезой рассматривают и противоречащую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то имеет место противоречащая гипотеза. По этой причине эти гипотезы целесообразно различать.
Нулевой (основной) называют выдвинутую гипотезу H0.
Конкурирующей (альтернативной) называют гипотезу Н1, которая противоречит нулевой.
Например, если нулевая гипотеза состоит в предположении, что математическое ожидание а нормального распределения равно 10, то конкурирующая гипотеза, в частности, может состоять в предположении, что а 10. Коротко это записывают так: H0:а=10; Н1 а=10.
Различают гипотезы, которые содержат только одно и более одного предположений.
Простой называют гипотезу, содержащую только одно предположение. Например, если параметр показательного распределения, то гипотеза H0: =5 –простая. Гипотеза: математическое ожидание нормального распределения равно 3 ( известно) — простая.
Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез. Например, сложная гипотеза Н : > 5 состоит из бесчисленного множества простых вида Hi: = вi, где вi – любое число, большее 5. Гипотеза : математическое ожидание нормального распределения равно 3 ( неизвестно) — сложная.
Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. Поскольку проверку производят статистическими методами, ее называют статистической. В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т. Е. могут быть допущены ошибки двух родов.
Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза.
Ошибка второго рода состоит в том, что будет принята неправильная гипотеза.
Подчеркнем, что последствия этих ошибок могут оказаться весьма различными. Например, если отвергнуто правильное решение «продолжать строительство жилого дома», то эта ошибка первого рода повлечет материальный ущерб; если же принято неправильное решение «продолжать строительство», несмотря на опасность обвала стройки, то эта ошибка второго рода может повлечь гибель людей. Можно привести примеры, когда ошибка первого рода влечет более тяжелые последствия, чем ошибка второго рода.
Замечание 1. Правильное решение может быть принято также в двух случаях:
1) гипотеза принимается, причем и в действительности она правильная;
гипотеза отвергается, причем и в действительности она неверна.
Замечание 2. Вероятность совершить ошибку первого рода
принято обозначать через а; ее называют уровнем значимости. Наиболее часто уровень значимости принимают равным 0,05 или 0,01. Если, например, принят уровень значимости, равный 0,05, то это означает, что в пяти случаях из ста имеется риск допустить ошибку первого рода (отвергнуть правильную гипотезу).
Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближенное распределение которой известно. Эту величину обозначают через U или Z, если она распределена нормально, F или v2 – по закону Фишера – Снедекора, Т — по закону Стьюдента, - по закону «хи квадрат» и т. Д. Поскольку вид распределения во внимание приниматься не будет, обозначим эту величину в целях общности через K.
Статистическим критерием (или просто критерием) называют случайную величину K, которая служит для проверки нулевой гипотезы.
Например, если проверяют гипотезу о равенстве дисперсий двух нормальных генеральных совокупностей, то в качестве критерия К принимают отношение исправленных выборочных дисперсий:
Эта величина случайная, потому что в различных опытах дисперсии принимают различные, наперед неизвестные значения, и распределена по закону Фишера – Снедекора.
Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин и таким образом получают частное (наблюдаемое) значение критерия.
Наблюдаемым значением Кнабл называют значение критерия, вычисленное по выборкам. Например, если по двум выборкам найдены исправленные выборочные дисперсии s = 20 и s = 5, то наблюдаемое значение критерия F
После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другая — при которых она принимается.
Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.
Областью принятия гипотезы (областью допустимых
значений) называют совокупность значений критерия, при
которых гипотезу принимают.
Основной принцип проверки статистических гипотез
можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области, гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы – гипотезу принимают.
Поскольку критерий К- одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют.
Критическими точками (границами) kкр называют точки, отделяющие критическую область от области принятия гипотезы.
- Учебная программа дисциплины
- 2. Данные о дисциплине:
- Пререквизиты:
- Краткое описание дисциплины
- График выполнения и сдачи заданий по дисциплине
- 1.7 Список литературы
- 1.8 Оценка знаний согласно шкале рейтинга
- 1.9 Политика и процедура
- Учебно-методические материалы по дисциплине
- 2.3 Планы практических занятий
- Оценка участия в семинарах
- Планы домашних заданий
- Содержание домашних заданий
- Оценка домашних заданий
- Планы занятий в рамках самостоятельной работы студентов под руководством преподавателя Содержание заданий для срсп
- Оценка заданий для срсп
- Планы занятий в рамках самостоятельной работы студентов
- Вопросник для коллоквиума
- Матрицы и операции над ними.
- Определители и их свойства.
- Системы линейных алгебраических уравнений.
- Векторы. Линейные операции над векторами.
- Нелиейные операции над векторами. Метод координат
- Прямая на плоскости.
- Кривые 2-го порядка.
- Уравнение плоскости.
- Прямая в пространстве. Взаимное расположение прямой и плоскости в пространстве.
- Функция. Действительные числа. Предел функции. Односторонние пределы функции.
- Элементарные функции
- Предел функции. Основные теоремы о пределах
- Замечательные пределы. Сравнение бесконечно малых функций. Широко используются следующие два предела
- Непрерывность функции. Классификация точек разрыва функции.
- Производная. Правила и формулы дифференцирования.
- Производные высших порядков. Дифференциалы первого и высших порядков и их приложения.
- Основные теоремы дифференциального исчисления (Ферма, Ролля, Лагранжа, Коши). Правило Лопиталя. Приложения производной и исследование функции.
- Исследование поведения функции и построение их графиков.
- Выпуклость графика функции. Точки перегиба
- Асимтоты.
- Первообразная. Неопределенный интеграл и его свойства.
- Интегрирование рациональных функций.
- Интегрирование иррациональных и трансцендентных функций.
- Определенный интеграл. Условия существования определенного интеграла. Свойства определенного интеграла.
- Проведя в точках деления a,b прямые, параллельные оси ординат, разобьем криволинейную трапецию на n частичных трапеций. В каждом частичном интервале возьмем точки 1,2,…,т, так что
- Оценка интеграла. Теорема о среднем. Формула Ньютона-Лейбница. Замена переменных и интегрирование по частям в определенном интеграле.
- Приложения определенного интеграла.
- Частные производные и дифференцируемость функций нескольких переменных.
- Частные производные высших порядков
- Лекции 29. Дифференциальные уравнения. Дифференциальные уравнения I порядка.
- Линейные дифференциальные уравнения второго порядка. Линейные дифференциальные уравнения второго порядка с постоянными коэффициентами.
- Числовые ряды.
- Признаки сходимости рядов
- Степенные ряды. Интервал сходимости степенного ряда. Разложение функций в степенные ряды.
- Свойства степенных рядов.
- Двойные и тройные интегралы.
- Векторные и скалярные поля
- Криволинейные интегралы
- Случайные события. Определение вероятности.
- Теоремы сложения и умножения вероятностей. Формула полной вероятности. Формула Байеса.
- Формула Бернулли. Предельные теоремы.
- Случайные величины и их числовые характеристики.
- Задачи математической статистики. Выборочный метод. Эмпирическая функция распределения. Полигон и гистограмма.
- Параметры распределения.
- Точечные и интервальные оценки.
- Элементы теории корреляции.
- Статистическая проверка статистических гипотез.