logo
Мат_моделир_2015_заоч_ЭП_ФИН / Мат_мод_лекции

3.6. Сила корреляционной связи

Введем обозначения: – условное среднее значение случайной величины(при условии, что случайная величина Х фиксирована); У=у – условное среднее значение случайной величины Х.

Если рассмотреть условное среднее значение случайной величины при всех значениях случайной величины Х, то получим уравнение регрессии величинына величину Х. Аналогично определяется уравнение регрессии Х на. Уравнение регрессии является оценкой функции регрессии.

Если уравнения регрессии известны, то можно по значению одной случайной величины прогнозировать значение другой случайной величины.

Если есть основания предполагать, что изучаемые случайные величины связаны некоторой корреляционной зависимостью, то задача ее определения решается в два этапа:

Рассмотрим модель линейной регрессии

(3.7)

Параметры называют коэффициентами регрессии. Параметрвыражает силу связи: чем он больше, тем связь между случайными величинами сильнее. Коэффициенты регрессии должны быть подобраны таким образом, чтобы линия регрессии проходила как можно ближе ко всем точкам корреляционного поля, т.е. практически через его центр.

В 1806г. французский математик Лежандр показал, что наилучшим образом будет отражать связь между переменными линия, для которой выполняется условие

, (3.8)

где – наблюдаемое (фактическое) значение случайной величины;– соответствующее расчетное среднее значение случайной величины.

Разность называется отклонением значения случайной величиныот соответствующего среднего значения. Уравнение (3.8) представляет собой математическую запись метода наименьших квадратов, в соответствии с которым коэффициенты регрессии определяют из условия минимума суммы квадратов отклонений.

Пусть имеем двумерную выборку результатов эксперимента, т.е. известны значения

Тогда и сумма (3.8) является функцией параметров

(3.9)

Необходимое условие минимума функции многих переменных заключается в равенстве нулю всех ее частных производных, т.е.

(3.10)

Раскроем скобки, произведем суммирование и переставим местами уравнения.

(3.11)

Делим на n

В итоге получаем

(3.12)

Решаем систему (3.12) методом подстановки. Для этого выражаем коэффициент bиз первого уравнения

(3.13)

и подставляем (3.13) во второе уравнение системы (3.12). После выполнения преобразований получим:

(3.14)

где – выборочный коэффициент корреляции;- выборочные стандартные отклонения случайных величин .

При определении коэффициентов линейной регрессиивыполнялась минимизация суммы (3.8), т.е. рассматривались отклонения по вертикали.

Запишем линейную регрессию

(3.15)

и соответствующую сумму квадратов отклонений

(3.16)

т.е. коэффициенты определяются в результате минимизации суммы квадратов отклонений по горизонтали:

(3.17)

Оценка точности (надежности) уравнений регрессии выполняется на основе регрессионных статистик (критериев): остаточной дисперсии, критерии Фишера (- статистика),- статистики Стьюдента и коэффициенте детерминации. Расчет критериев приведен в работе [10].