43.Критерий согласия Пирсона «Хи-квадрат» ( )
На практике часто возникают задачи, связанные с тем, что вид закона распределения исследуемого признака – гипотетический и подлежит проверке. Если проводить графическое сравнение полигона или гистограммы частот с кривой распределения, то можно получить представление, по крайней мере с качественной стороны, о большей или меньшей близости теоретического и эмпирического распределений.
Предположим, что выборка извлечена из генеральной совокупности с неизвестной теоретической функцией распределения , относительно которой имеются две непараметрические гипотезы: простая основная Н0: и сложная конкурирующая Н1: , где - известная функция распределения. Иными словами, мы хотим проверить, согласуются ли исходные данные с нашим гипотетическим предположением относительно теоретического закона распределения или нет. Поэтому критерий для проверки гипотез Н0 и Н1 называются критериями согласия.
Существуют различные критерии согласия, например, критерий согласия Пирсона , критерий согласия Колмогорова. Приведем один из наиболее часто используемых критериев согласия – критерий согласия Пирсона .
Предположим, что проверяется основная гипотеза Н0: исследуемый признак Х имеет распределение , против конкурирующей противоположной гипотезы при уровне значимости . Здесь - функция распределения исследуемого признака Х, известная с точностью до параметров . В силу взаимно однозначного соответствия между функцией распределения и рядом (плотностью) распределения нулевая гипотеза Н0 может быть сформулирована также в терминах ряда (плотности) распределения. Если основная гипотеза простая, т.е. гипотетическое распределение исследуемого признака основной гипотезой определяется однозначно, то количество параметров распределений, требуемых оценки по выборке, m = 0.
Проверка нулевой гипотезы Н0 против альтернативной при уровне значимости проводится по следующей схеме:
Исходя из выборочных данных, находят оценки неизвестных параметров распределения . Найденные оценки используются в дальнейшем вместо неизвестных параметров распределения.
Вся область изменения признака Х разбивается на k непересекающихся интервалов при i = 1, 2, …, k. Если признак Х принимает значения на всей вещественной оси, то полагаем и правый конец . Если признак Х принимает только положительные значения, то полагаем и правый конец . Подсчитываются далее величины - количество выборочных данных, попавших в i-тый интервал при i = 1, 2, …, k. Интервалы выбирают обычно таким образом, чтобы все были не меньше . Очевидно, − объем выборки.
Находятся теоретические вероятности того, что исследуемый признак Х примет какое–либо значение из промежутка :
, i = 1, 2, …, k.
Если исследуемый признак дискретный, то
,
где суммирование ведется по всем значениям индекса r, для которых , i = 1, 2, …, k.
Очевидно, должно выполняться равенство .
4. Вычисляется мера расхождения между теоретическим и эмпирическим распределением:
,
где - эмпирические частоты признака Х, - теоретические частоты, - вероятности, рассчитанные по предполагаемому теоретическому распределению.
Для выбранного уровня значимости по таблице распределения находят критическое значение при числе степеней свободы , где k – число выборочных групп, m - число параметров теоретического распределения, определяемого по опытным данным.
Производится сравнение вычисленного по выборке значения с табличным значением . Если значения < , то считается, что выборочные данные согласуются с нулевой гипотезой Н0. В противном случае нулевая гипотеза Н0 отвергается, она опровергается имеющимися данными в пользу альтернативной.
Задача. Получено следующее распределение 100 рабочих цеха по выработке в отчетном году (в % к предыдущему году):
Выработка в отчетной году (в % к предыдущему году) |
|
|
|
|
|
|
Количество рабочих | 6 | 20 | 45 | 24 | 5 | 100 |
С помощью критерия согласия Пирсона проверить гипотезу о том, что выработка на одного рабочего в отчетном году (в % к предыдущему) подчиняется нормальному закону распределения. Уровень значимости критерия принять равным 0,05.
Решение. Нулевая гипотеза Н0 состоит в том, что исследуемый признак Х – выработка на одного рабочего в отчетном году (в % к предыдущему) подчиняется нормальному закону распределения.
В качестве оценок двух неизвестных параметров а и будут фигурировать соответствующие выборочные характеристики: и . Можно показать, что . Исследуемый признак принимает значения на всей вещественной оси (в принципе, но не в реальности!). Поэтому интервалы разбиения таковы, что левый конец и правый конец .
Теоретические вероятности находятся по формуле
, i = 1, 2, … , k.
Необходимые для этих вычислений значения функции взяты из таблицы Приложения. Дальнейшие выкладки сведены ниже в таблицу. При этом объединены два последних интервала группировки ввиду их малочисленности.
№ п/п | Интервал группировки | Частота |
| Функция | Веро-ятность |
|
|
1 |
| 6 | −∞ | −0,5 | 0,053 | 5,3 | 0,092 |
2 |
| 20 | −1,62 | −0,447 | 0,238 | 23,8 | 0,636 |
3 |
| 45 | −0,55 | −0,209 | 0,404 | 40,4 | 0,524 |
4 |
| 24 | 0,51 | 0,195 | 0,248 | 24,8 | 0,026 |
5 |
| 5 | 1,57 | 0,442 | 0,057 | 5,7 | 0,11 |
7 | − | − | + ∞ | 0,5 | − | − | − |
| − | 100 | − | − | 1,00 | 100 |
|
Вычисленное статистическое значение критерия . По количеству интервалов группировки k = 5, числу параметров нормального распределения найдем число степеней свободы 5 – 3 = 2. Для заданного уровня значимости критерия и числа степеней свободы, равного 2, находим . Так как , то нулевая гипотеза о нормальности распределения величины выработки рабочего согласуется с имеющимися данными.
- Бийский технологический институт (филиал)
- Теория вероятностей и математическая статистика
- Введение
- События. Классификация событий. Классическое определение вероятности
- Статистическое определение вероятности
- Геометрическая вероятность
- Контрольные вопросы
- Контрольные задания
- 4. Операции над событиями. Соотношения между событиями
- 5.Теорема сложения вероятностей
- 6. Теорема умножения вероятностей
- Контрольные вопросы
- Контрольные задания
- 7. Формула полной вероятности
- 8. Теорема гипотез (формула Бейеса)
- Контрольные вопросы
- Контрольные задания
- Литература
- 9. Повторение опытов. Формула Бернулли
- 10. Локальная формула Муавра-Лапласа. Формула Пуассона
- 11. Интегральная формула Муавра-Лапласа. Вероятность отклонения частоты события от его вероятности в n независимых испытаниях
- Контрольные вопросы
- Контрольные задания
- Литература
- 12. Понятие случайной величины. Ряд распределения. Многоугольник распределения
- 13. Функция распределения. Вероятность попадания непрерывной случайной величины в заданный интервал
- Контрольные вопросы
- Контрольные задания
- 14. Плотность распределения
- Контрольные вопросы
- Контрольные задания
- 15. Числовые характеристики случайных величин. Математическое ожидание и его свойства
- Свойства математического ожидания
- 16. Дисперсия и ее свойства. Среднее квадратическое отклонение
- 17. Моменты распределения случайной величины
- Контрольные вопросы
- Контрольные задания
- 18. Типы распределений дискретных случайных величин
- Биномиальное распределение
- 18.2 Гипергеометрическое распределение
- 18.3 Геометрическое распределение
- 4. Распределение Пуассона
- Контрольные вопросы
- Контрольные задания
- 19. Типы распределений непрерывных случайных величин
- 19.1 Равномерное распределение
- 19.2 Показательное распределение
- 20. Нормальный закон распределения
- 21. Вероятность попадания нормально распределенной случайной величины в заданный интервал. Правило трёх сигма
- Контрольные вопросы
- Контрольные задания
- Литература
- 22. Понятие системы случайных величин
- 23. Закон распределения вероятностей дискретной двумерной случайной величины
- Контрольные вопросы
- 24. Функция распределения двух случайных величин. Вероятность попадания случайной величины в полуполосу и прямоугольник
- 25. Плотность распределения системы двух случайных величин. Законы распределения отдельных величин, входящих в систему
- 26. Условные законы распределения
- Контрольные вопросы
- 27. Зависимые и независимые случайные величины
- 28. Числовые характеристики составляющих системы двух случайных величин. Условное математическое ожидание
- 29. Корреляционный момент. Коэффициент корреляции
- 30. Коррелированность и зависимость случайных величин
- Если величины независимы, то они некоррелированы.
- 31. Линейная регрессия. Прямые линии среднеквадратической регрессии
- Контрольные вопросы
- Контрольные задания
- Литература
- 32. Закон больших чисел
- 33. Центральная предельная теорема
- Контрольные вопросы
- Контрольные задания
- Литература
- Математическая статистика
- 34. Понятие о выборочном методе. Генеральная и выборочная совокупность
- 35. Статистические данные и их представление
- 36. Статистические аналоги теоретических законов распределения
- 36.1 Эмпирическая функция распределения
- 36.2 Полигон и гистограмма
- Контрольные вопросы
- Контрольные задания
- Литература
- 37. Точечное оценивание параметров распределения
- 38. Свойства статистических оценок
- Контрольные вопросы
- Контрольные задания
- 39. Интервальное оценивание параметров распределения
- 40. Интервальное оценивание параметров нормального распределения
- 40.1 Интервальная оценка математического ожидания нормального распределения при известной дисперсии
- 40.2 Интервальная оценка математического ожидания нормального распределения при неизвестной дисперсии
- Контрольные вопросы
- Контрольные задания
- Литература
- 41. Статистические гипотезы
- 42. Критерии проверки гипотез
- Контрольные вопросы
- Контрольные задания
- 43.Критерий согласия Пирсона «Хи-квадрат» ( )
- Контрольные вопросы
- Контрольные задания
- Литература
- 44. Элементы теории корреляции. Задачи корреляционного анализа
- 45. Выбор формы зависимости между переменными. Метод наименьших квадратов
- Контрольные вопросы
- 46. Коэффициент корреляции и проверка его значимости. Линейная регрессия и прогноз
- Контрольные вопросы
- Контрольные задания
- Литература
- Глоссарий