logo
Міністерство освіти та науки Україн1

Однофакторний дисперсійний аналіз

Якщо результати спостережень можна подати у вигляді моделі

,

де — і-те спостереження в j-ій групі ( ), — кількість спостережень в j-ій групі, , k — кількість груп, що відповідають різним значенням вимушуючого фактора, — значення в j-ій групі, яке характеризує вплив вимушуючого фактора, а — незалежні і мають близький до нормального розподіл з математичним сподіванням 0 і дисперсією , то для перевірки гіпотези про відсутність впливу вимушуючого фактора на рівень досліджуваної ознаки можна застосувати однофакторний дис­пер­сій­ний аналіз. Альтернативною виступає гіпотеза про наявність такого впливу.

Суть методу полягає в порівнянні двох оцінок цієї дисперсії, одна з яких отримана у припущенні, що всі статистично не відрізняються одне від одного (виконується нульова гіпотеза).

Оскільки , де випадкова величина має розподіл з ступенем вільності, а сума k таких незалежних величин має розподіл з ступенями вільності, то оцінкою дисперсії може служити величина

,

яку називають внутрішьогруповою дисперсією. Зауважимо, що ця оцінка отримана незалежно від виконання чи невиконання нульової гіпотези.

Якщо припустити, що всі дорівнюють одне одному (виконується нульова гіпотеза), то для оцінки можна скористатися величиною (тут , а випадкова величина має розподіл з ступенем вільності). Тоді оцінкою дисперсії може служити величина

,

яку називають міжгруповою дисперсією. Ця величина істотно залежить від виконання нульової гіпотези і буде тим більшою чим більше відрізняються між собою (зрозуміло, що оцінкою в наших припущеннях виступають ).

Оскільки обидві оцінки статистично незалежні, то при виконанні нульової гіпотези статистика

матиме розподіл Фішера-Снедекора з ступенями вільності. Таким чином нульова гіпотеза прийматиметься на рівні значущості при і відхилятиметься у протилежному випадку.

Якщо нульова гіпотеза відхиляється, то для порівняння середніх при різних значеннях вимушуючого фактора можна скористатись статистикою Шеффе

.

Її критичне значення на рівні значущості може бути обчислене за формулою

,

де — критичне значення статистики Фішера з ступенями вільності.

У пакеті Statistica 6.0 однофакторний дисперсійний аналіз реалізовано у субмодулі Breakdown & one-way ANOVA модуля Basic Statistics and Tables.

Приклад 37. Застосовуючи однофакторний дисперсійний аналіз перевірити залежність інтегрального показника якості життя хворих епілепсією від частоти припадків за даними прикладу 33.

Розв’язання: Сформулюємо статистичні гіпотези.

Н0: Частість епілептичних припадків не впливає на рівень показника якості життя.

Н1: Має місце тенденція до зниження рівня показника якості життя з ростом частоти епілептичних припадків.

Скористаємось даними прикладу 33, внесеними у пакет Statistica 6.0.

Перевірка показує, що розподіл змінної ЯЖ статистично не відрізняється від нормального ( ). Отже, є підстави для застосування однофакторного дисперсійного аналізу.

У модулі Basic Statistics and Tables вибираємо субмодуль Breakdown & one-way ANOVA. В якості залежної вибираємо змінну ЯЖ, групуючої — Част. Натискаємо кнопку Codes for grouping variables і вибираємо всі наявні коди (All). Натисканням Ok переходимо до наступного субмодуля. Далі на закладці ANOVA & tests натискаємо кнопку Analysis of Variance. Результати аналізу показано на рис. 28. Як бачимо міжгрупова дисперсія (MS Effect) дорівнює 1959,264, внутрішньогрупова (MS Error) — 183,197. Емпіричне значення статистики Фішера дорівнює 10,7, що відповідає рівню значущості 0,000063. Це дає підстави відхилити нульову гіпотезу.

Д алі для запуску тесту Шефе на закладці Post-hoc натискаємо кнопку Scheffe test. Результати тесту показано на рис. 29.

Як бачимо середнє значення інтегрального показника якості життя у хворих з рідкими припадками істотно вищий, ніж у хворих з частими і дуже частими припадками ( р = 0,0002 та р = 0,0007). Однак у хворих з дуже частими припадками він статистично такий же, як і у хворих з частими припадками ( р = 0,991).