[Править] Статистика объектов нечисловой природы
Методы статистики объектов нечисловой природы (статистики нечисловых данных, или нечисловой статистики) применяют всегда, когда результаты наблюдений являются объектами нечисловой природы. Например, сообщениями о годности или дефектности единиц продукции. Информацией о сортности единиц продукции. Разбиениями единиц продукции на группы соответственно значения контролируемых параметров. Упорядочениями единиц продукции по качеству или инвестиционных проектов по предпочтительности. Фотографиями поверхности изделия, пораженной коррозией, и так далее. Итак, объекты нечисловой природы — это измерения по качественному признаку, множества, бинарные отношения (разбиения, упорядочения и др.) и многие другие математические объекты [2]. Они используются в различных вероятностно-статистических методах принятия решений. В частности, в задачах управления качеством продукции, а также, например, в медицине и социологии, как для описания результатов приборных измерений, так и для анализа экспертных оценок.
Для описания данных, являющихся объектами нечисловой природы, применяют, в частности, таблицы сопряженности, а в качестве средних величин — решения оптимизационных задач [2]. В качестве выборочных средних для измерений в порядковой шкале используют медиану и моду, а в шкале наименований — только моду. О методах классификации нечисловых данных говорилось выше.
Для решения параметрических задач оценивания используют оптимизационный подход, метод одношаговых оценок, метод максимального правдоподобия, метод устойчивых оценок. Для решения непараметрических задач оценивания наряду с оптимизационными подходами к оцениванию характеристик используют непараметрические оценки распределения случайного элемента, плотности распределения, функции, выражающей зависимость [2].
В качестве примера методов проверки статистических гипотез для объектов нечисловой природы рассмотрим критерий «хи-квадрат» (обозначают φ2), разработанный К.Пирсоном для проверки гипотезы однородности (другими словами, совпадения) распределений, соответствующих двум независимым выборкам.
Рассматриваются две выборки объемов n1иn2, состоящие из результатов наблюдений качественного признака, имеющегоkградаций. Пустьm1jиm2j— количества элементов первой и второй выборок соответственно, для которых наблюдаетсяj-я градация, аp1jиp2j— вероятности того, что эта градация будет принята, для элементов первой и второй выборок,j= 1,2,...,k.
Для проверки гипотезы однородности распределений, соответствующих двум независимым выборкам,
,
применяют критерий φ2(хи-квадрат) со статистикой
;.
Установлено [9, 11], что статистика X2при больших объемах выборокn1иn2имеет асимптотическое распределение хи-квадрат с (k− 1) степенью свободы.
Пример 3. В таблице приведены данные о содержании серы в углеродистой стали, выплавляемой двумя металлургическими заводами. Проверим, можно ли считать распределения примеси серы в плавках стали этих двух заводов одинаковыми.
Распределения плавок стали по процентному содержанию серы | ||
Содержание серы, в % | Число плавок | |
Завод А | Завод Б | |
0,00—0,02 | 82 | 63 |
0,02—0,04 | 535 | 429 |
0,04—0,06 | 1173 | 995 |
0,06—0,08 | 1714 | 1307 |
Расчет по данным дает X2= 3,39. Квантиль порядка 0,95 распределения χ-квадрат сk− 1 = 3 степенями свободы равен, поэтому гипотезу о совпадении функций распределения нельзя отклонить, а следует принять на уровне значимости α = 0,05.
Выше дано лишь краткое описание содержания прикладной статистики на современном этапе. Подробное изложение конкретных методов содержится в специальной литературе.
- Проверка статистических гипотез
- Статистические гипотезы
- 1. Простые и сложные гипотезы и их проверка
- 2. Критерий согласия Пирсона
- Поведение , когда гипотезаверна.
- Поведение , когда гипотезаневерна.
- Критерий проверки.
- Границы применимости критерия на практике.
- 3. Критерий согласия для сложных гипотез
- 4. О критериях согласия Колмогорова и Смирнова
- 5. Проверка нормальности при помощи вероятностной бумаги
- Статистические критерии.
- [Править] Уровень значимости и мощность.
- [Править] Состоятельность и несмещенность критериев.
- [Править] Некоторые типовые задачи прикладной статистики [править] Статистические данные и прикладная статистика
- [Править] Статистический анализ точности и стабильности технологических процессов и качества продукции
- [Править] Задачи одномерной статистики (статистики случайных величин)
- [Править] Непараметрическое оценивание математического ожидания.
- [Править] Непараметрическое оценивание функции распределения.
- [Править] Таблица 1
- [Править] Проблема исключения промахов.
- [Править] Многомерный статистический анализ
- [Править] Корреляция и регрессия.
- [Править] Дисперсионный анализ.
- [Править] Методы классификации.
- [Править] Дискриминантный анализ.
- [Править] Кластер-анализ.
- [Править] Задачи группировки.
- [Править] Снижение размерности.
- [Править] Статистика случайных процессов и временных рядов
- [Править] Статистика объектов нечисловой природы
- Лабораторная работа №14. Изучение критериев Колмогорова и омега-квадрат
- Лабораторная работа №15. Изучение критерия хи-квадрат Пирсона