logo
Статистика

[Править] Статистика объектов нечисловой природы

Методы статистики объектов нечисловой природы (статистики нечисловых данных, или нечисловой статистики) применяют всегда, когда результаты наблюдений являются объектами нечисловой природы. Например, сообщениями о годности или дефектности единиц продукции. Информацией о сортности единиц продукции. Разбиениями единиц продукции на группы соответственно значения контролируемых параметров. Упорядочениями единиц продукции по качеству или инвестиционных проектов по предпочтительности. Фотографиями поверхности изделия, пораженной коррозией, и так далее. Итак, объекты нечисловой природы — это измерения по качественному признаку, множества, бинарные отношения (разбиения, упорядочения и др.) и многие другие математические объекты [2]. Они используются в различных вероятностно-статистических методах принятия решений. В частности, в задачах управления качеством продукции, а также, например, в медицине и социологии, как для описания результатов приборных измерений, так и для анализа экспертных оценок.

Для описания данных, являющихся объектами нечисловой природы, применяют, в частности, таблицы сопряженности, а в качестве средних величин — решения оптимизационных задач [2]. В качестве выборочных средних для измерений в порядковой шкале используют медиану и моду, а в шкале наименований — только моду. О методах классификации нечисловых данных говорилось выше.

Для решения параметрических задач оценивания используют оптимизационный подход, метод одношаговых оценок, метод максимального правдоподобия, метод устойчивых оценок. Для решения непараметрических задач оценивания наряду с оптимизационными подходами к оцениванию характеристик используют непараметрические оценки распределения случайного элемента, плотности распределения, функции, выражающей зависимость [2].

В качестве примера методов проверки статистических гипотез для объектов нечисловой природы рассмотрим критерий «хи-квадрат» (обозначают φ2), разработанный К.Пирсоном для проверки гипотезы однородности (другими словами, совпадения) распределений, соответствующих двум независимым выборкам.

Рассматриваются две выборки объемов n1иn2, состоящие из результатов наблюдений качественного признака, имеющегоkградаций. Пустьm1jиm2j— количества элементов первой и второй выборок соответственно, для которых наблюдаетсяj-я градация, аp1jиp2j— вероятности того, что эта градация будет принята, для элементов первой и второй выборок,j= 1,2,...,k.

Для проверки гипотезы однородности распределений, соответствующих двум независимым выборкам,

,

применяют критерий φ2(хи-квадрат) со статистикой

;.

Установлено [9, 11], что статистика X2при больших объемах выборокn1иn2имеет асимптотическое распределение хи-квадрат с (k− 1) степенью свободы.

Пример 3. В таблице приведены данные о содержании серы в углеродистой стали, выплавляемой двумя металлургическими заводами. Проверим, можно ли считать распределения примеси серы в плавках стали этих двух заводов одинаковыми.

Распределения плавок стали по процентному содержанию серы

Содержание серы, в %

Число плавок

Завод А

Завод Б

0,00—0,02

82

63

0,02—0,04

535

429

0,04—0,06

1173

995

0,06—0,08

1714

1307

Расчет по данным дает X2= 3,39. Квантиль порядка 0,95 распределения χ-квадрат сk− 1 = 3 степенями свободы равен, поэтому гипотезу о совпадении функций распределения нельзя отклонить, а следует принять на уровне значимости α = 0,05.

Выше дано лишь краткое описание содержания прикладной статистики на современном этапе. Подробное изложение конкретных методов содержится в специальной литературе.