logo search
11_Конспекты лекций

4. Коэффициент детерминации и корреляционное отношение.

Согласно основной идее дисперсионного анализа

,

где - групповая средняя для i-го уровня фактора.

Последнее равенство запишем в виде:

Q = QR + Qe ,

где Q – общая сумма квадратов отклонений зависимой переменной от средней, QR – сумма квадратов, обусловленная регрессией, а Qe - остаточная сумма квадратов, характеризующая влияние неучтенных факторов.

Схему дисперсионного анализа представим в виде таблицы:

Компоненты

дисперсии

Сумма

квадратов

Число степеней

свободы

Средние

квадраты

Регрессия

QR=

m-1

Остаточная

Qe=

mn-m

Общая

Q=

mn-1

Часто возникает необходимость в достоверном показателе интенсивности связи при любой форме зависимости. Для получения такого показателя запишем правило сложения дисперсий:

sy2 = siy/ 2 + δiy 2,

где sy2 – общая дисперсия переменной y, siy/ 2 – средняя групповых дисперсий siy2 или остаточная дисперсия и δiy 2 – межгрупповая дисперсия. Остаточная диспесия измеряет ту часть колеблемости Y, которая возникает из-за изменчивости неучтенных факторов, не зависящих от Х. Межгрупповая дисперсия выражает ту часть вариации Y, которая обусловлена изменчивостью Х.

Величина называется эмпирическим корреляционным отношением Y по Х. Чем теснее связь, тем большее влияние на вариацию переменной Y оказывает изменчивость Х по сравнению с неучтенными факторами, тем выше ηух. Величина ηух2 , называемая эмпирическим коэффициентом детерминации, показывает, какая часть общей вариации Y обусловлена вариацией Х. Аналогично вводится эмпирическое корреляционное отношение Х по Y.

Основные свойства корреляционных отношений:

1. Корреляционное отношение есть неотрицательная величина, не превосходящая 1: 0 ≤ η ≤ 1.

2. Если η = 0, то корреляционная связь отсутствует.

3. Если η = 1, то между переменными существует функциональная зависимость.

Эмпирическое корреляционное отношение ηух является показателем рассеяния точек корреляционного поля относительно эмпирической линии регрессии, которое преувеличивает тесноту связи. Поэтому рассматривается показатель тесноты связи Ryx, характеризующий рассеяние точек корреляционного поля относительно линии регрессии ух. Показатель Ryx получил название теоретического корреляционного отношения или индекса корреляции Y по Х:

.

Можно показать, что Ryx = .

Коэффициент детерминации R2, равный квадрату индекса корреляции, показывает долю общей вариации зависимой переменной, обусловленной регрессией или изменчивостью объясняющей переменной. Чем ближе R2 к 1, тем теснее наблюдения примыкают к линии регрессии, тем лучше регрессия описывает зависимость переменных.

Расхождение между η2 и R2 может быть использовано для проверки линейности корреляционной зависимости.