6.3.3. Сравнение факторной и остаточной дисперсий
Пусть все выборки (6.1) характеризуют одну случайную величину Х при различных значениях фактора Φ, т.е. каждый слой соответствует одному количественному или качественному значению фактора. Сравнение дисперсий производится в следующем порядке:
рассчитывается среднее значение (оценка математического ожидания) по всей совокупности наблюдений
,
где n=n1+n2+…+nm , а хij – j-й элемент i-го слоя;
вычисляются средние значения для всех слоев (групп) ;
определяется общая сумма квадратов отклонений наблюдаемых значений от оценки математического ожидания
; (6.7)
определяется факторная сумма квадратов отклонений средних по слоям от оценки математического ожидания (характеризует рассеяние между слоями)
; (6.8)
определяется остаточная сумма квадратов отклонений наблюдаемых значений внутри слоя от своей средней
. (6.9)
Величина Sфакт характеризует влияние фактора Φ. Это положение можно пояснить следующим образом. Пусть фактор оказывает существенное влияние на величину Х. Тогда результаты наблюдения для одного слоя, вообще говоря, отличаются от результатов, представленных в других слоях. Следовательно, различаются и средние значения по слоям, причем они тем больше отличаются от оценки математического ожидания по всей выборке, чем больше проявляется влияние фактора. Таким образом, сумма квадратов отклонений средних по слоям от общей средней и характеризует влияние фактора (возведение отклонений во вторую степень исключает взаимную компенсацию положительных и отрицательных отклонений).
Наблюдения внутри одного слоя различаются из-за воздействия случайных причин. Именно сумма квадратов отклонений наблюдаемых значений в каждом слое от среднего значения в слое и характеризует воздействие этих причин, т.е. величина Sост отражает суммарное влияние случайных причин на значение величины Х.
Величина Sобщ, как сумма квадратов отклонений конкретных значений от среднего значения, характеризует суммарное влияние фактора и случайных причин. Можно показать, что
Sобщ = Sост + Sфакт,
тогда для вычисления остаточной суммы квадратов можно воспользоваться более простым соотношением
Sост = Sобщ – Sфакт.
Разделив суммы квадратов отклонений на соответствующее число степеней свободы, получим оценки общей, факторной и остаточной дисперсий:
(6.10)
Если средние значения случайной величины, вычисленные по отдельным выборкам одинаковы, то оценки факторной и остаточной дисперсий являются несмещенными оценками генеральной дисперсии и различаются несущественно. Тогда сопоставление оценок этих дисперсий по критерию Р. Фишера
F = μ2факт /μ2ост
должно показать, что нулевую гипотезу о равенстве факторной и остаточной дисперсий отвергнуть нет оснований. Если μ2факт < μ2ост, то нет необходимости прибегать к вычислению критерия Р. Фишера – из неравенства сразу следует вывод о выполнении нулевой гипотезы. Итак, из справедливости гипотезы о равенстве средних величин по группам следует соблюдение гипотезы о равенстве факторной и остаточной дисперсий.
Если нулевая гипотеза о равенстве средних величин по слоям является ложной, то с увеличением расхождения между слоями возрастает оценка факторной дисперсии, а вместе с ней и величина критерия F = μ2факт /μ2ост. В результате значение F превысит критическое значение, и гипотеза о равенстве дисперсий будет отвергнута.
Рассуждая от противного, можно доказать справедливость утверждений: из справедливости (ложности) гипотезы о дисперсиях следует истинность (ложность) гипотезы о математических ожиданиях. Таким образом, вместо проверки нулевой гипотезы Н0 о равенстве средних значений для совокупности выборок следует проверить гипотезу о равенстве факторной и остаточной дисперсий.
Пример 6.2. Методом дисперсионного анализа при уровне значимости 0,05 проверить нулевую гипотезу о равенстве средних значений по слоям, применительно к результатам наблюдений, табл. 6.1. Предполагается, что выборки принадлежат нормальному распределению, а каждый слой соответствует некоторому значению фактора Φ.
Решение. Необходимо проверить однородность дисперсий, а затем непосредственно провести дисперсионный анализ. Проверим гипотезу об однородности дисперсий. Для этого вычислим:
оценки математического ожидания по слоям (групповые средние)
mгр 1 = 263,93; mгр 2 = 262,95; mгр 3 = 265,32;
несмещенные оценки дисперсии по слоям
m*2 (1) = 29,79; m*2 (2) = 54,20; m*2 (3) = 34,61;
усредненную оценку несмещенной дисперсии по всем слоям
m*2 =(29,79×5+54,20×6+34,61×6)/17 = 40,11.
значение критерия Бартлетта
В=a/c=0,56/1,08=0,52,
где а=2,303(17lg 40,11 – (5 lg 29,79+6 lg 54,20+6 lg 34,61)) = 0,56;
с = 1+(1/5+1/6+1/6 –1/17)/[3(3–1)]=1,08.
Критическое значение хи-квадрат для правосторонней области
c2кр(2; 0,05)=6,0.
Поскольку величина В меньше c2кр(2; 0,05), отвергнуть нулевую гипотезу об однородности дисперсий нет оснований.
Дисперсионный анализ предусматривает вычисление:
суммы квадратов
Sобщ = 701,65; Sфакт = 19,81; Sост = 681,84;
оценок дисперсий
μ*2 общ=701,65/19=36,93; μ*2 факт=19,81/2=9,91; μ*2 ост=681,84/17=40,10.
Оценка факторной дисперсии меньше оценки остаточной дисперсии, поэтому можно сразу утверждать справедливость нулевой гипотезы о равенстве математических ожиданий по слоям выборки, Иначе говоря, в данном примере фактор Φ не оказывает существенного влияния на случайную величину.
- Лекции по дисциплине курса «Теория вероятностей и математическая статистика»
- Часть II
- Введение
- 1. Закон больших чисел
- 1.2. Неравенства чебышева
- 1.3. Сходимость по вероятности
- 1.4.Теоремы чебышева
- 1.4.1.Первая теорема Чебышева.
- 1.4.2. Вторая теорема Чебышева:
- 1.5. Теорема бернулли
- 1.6. Центральная предельная теорема
- 1.7. Предельные теоремы
- 1.7.1. Локальная теорема Муавра-Лапласа.
- 1.7.2. Интегральная теорема Муавра-Лапласа.
- 2. Базовые понятия математической статистики
- 2.1. Эмпирическая функция распределения
- 2.2. Гистограмма
- 2.3. Оценки параметров распределения и их свойства
- 2.4. Оценки моментов и квантилей распределения
- 2.5. Точечная оценка параметров распределения
- 2.5.1. Сущность задачи точечного оценивания параметров
- 2.5.2. Метод максимального правдоподобия
- 2.5.3. Метод моментов
- 2.5.4. Метод квантилей
- 3. Проверка статистических гипотез
- 3.1. Сущность задачи проверки статистических гипотез
- 3.2. Типовые распределения
- 3.2.1. Нормальное распределение
- 3.2.2. Распределение χ2 (хи-квадрат)
- 3.2.3. Распределение Стьюдента
- 3.3.4. Распределение Фишера
- 3.3. Проверка гипотез о законе распределения
- 3.3.1. Критерий хи-квадрат к. Пирсона
- 3.3.2. Критерий а.Н. Колмогорова
- 3.3.3. Критерий р. Мизеса
- 4. Интервальная оценка параметров распределения
- 4.1. Сущность задачи интервального оценивания параметров
- 4.2. Общий метод построения доверительных интервалов
- 4.3. Доверительный интервал для математического ожидания
- 4.4. Доверительный интервал для дисперсии
- 4.5. Доверительный интервал для вероятности
- 5. Аппроксимация закона распределения экспериментальных данных
- 5.1. Задачи аппроксимации
- 5.2. Аппроксимация на основе типовых распределений
- 6. Обработка однотипных выборок
- 6.1. Однотипные выборки эд и задачи их обработки
- 6.2. Объединение выборок
- 6.2.1. Объединение однородных выборок
- 6.2.2. Объединение неоднородных выборок
- 6.3. Однофакторный дисперсионный анализ
- 6.3.1. Задачи дисперсионного анализа
- 6.3.2. Проверка однородности совокупности дисперсий
- 6.3.3. Сравнение факторной и остаточной дисперсий
- 7. Корреляционный и регрессионный анализ
- 7.1. Матрица данных
- 7.2. Корреляционный анализ
- 7.3. Регрессионный анализ
- 7.3.1. Постановка задачи
- 7.3.2. Выбор вида уравнения регрессии
- 7.3.4. Вычисление коэффициентов уравнения регрессии