logo
Статистика

[Править] Дисперсионный анализ.

Дисперсионный анализ применяют для изучения влияния качественных признаков на количественную переменную. Например, пусть имеются kвыборок результатов измерений количественного показателя качества единиц продукции, выпущенных наkстанках, то есть набор чисел (x1(j),x2(j),...,xn(j)), гдеj— номер станка,j= 1,2,...,k, аn— объем выборки. В распространенной постановке дисперсионного анализа предполагают, что результаты измерений независимы и в каждой выборке имеют нормальное распределениеN(m(j),σ2) с одной и той же дисперсией. Хорошо разработаны и непараметрические постановки[21].

Проверка однородности качества продукции, то есть отсутствия влияния номера станка на качество продукции, сводится к проверке гипотезы

.

В дисперсионном анализе разработаны методы проверки подобных гипотез. Теория дисперсионного анализа и расчетные формулы рассмотрены в специальной литературе [22].

Гипотезу H0проверяют против альтернативной гипотезыH1, согласно которой хотя бы одно из указанных равенств не выполнено. Проверка этой гипотезы основана на следующем «разложении дисперсий», указанном Р. А. Фишером:

, (7)

где s2— выборочная дисперсия в объединенной выборке, то есть

.

Далее, s2(j) — выборочная дисперсия вj-ой группе,

.

Таким образом, первое слагаемое в правой части формулы (7) отражает внутригрупповую дисперсию. Наконец, — межгрупповая дисперсия,

.

Область прикладной статистики, связанную с разложениями дисперсии типа формулы (7), называют дисперсионным анализом. В качестве примера задачи дисперсионного анализа рассмотрим проверку приведенной выше гипотезы H0в предположении, что результаты измерений независимы и в каждой выборке имеют нормальное распределениеN(m(j),σ2) с одной и той же дисперсией. При справедливостиH0первое слагаемое в правой части формулы (7), деленное на σ2, имеет распределение хи-квадрат сk(n− 1) степенями свободы, а второе слагаемое, деленное на σ2, также имеет распределение хи-квадрат, но с (k− 1) степенями свободы, причем первое и второе слагаемые независимы как случайные величины. Поэтому случайная величина

имеет распределение Фишера с (k− 1) степенями свободы числителя иk(n− 1) степенями свободы знаменателя. ГипотезаH0принимается, если, и отвергается в противном случае, гдеF1 − α— квантиль порядка 1 − α распределения Фишера с указанными числами степеней свободы. Такой выбор критической области определяется тем, что приH1величинаFбезгранично увеличивается при росте объема выборокn. ЗначенияF1 − αберут из соответствующих таблиц [8].

Разработаны непараметрические методы решения классических задач дисперсионного анализа [19], в частности, проверки гипотезы H0.