3.6. Сила корреляционной связи
Введем обозначения: – условное среднее значение случайной величины(при условии, что случайная величина Х фиксирована); У=у – условное среднее значение случайной величины Х.
Если рассмотреть условное среднее значение случайной величины при всех значениях случайной величины Х, то получим уравнение регрессии величинына величину Х. Аналогично определяется уравнение регрессии Х на. Уравнение регрессии является оценкой функции регрессии.
Если уравнения регрессии известны, то можно по значению одной случайной величины прогнозировать значение другой случайной величины.
Если есть основания предполагать, что изучаемые случайные величины связаны некоторой корреляционной зависимостью, то задача ее определения решается в два этапа:
устанавливается общий вид зависимости;
вычисляются ее параметры.
Рассмотрим модель линейной регрессии
(3.7)
Параметры называют коэффициентами регрессии. Параметрвыражает силу связи: чем он больше, тем связь между случайными величинами сильнее. Коэффициенты регрессии должны быть подобраны таким образом, чтобы линия регрессии проходила как можно ближе ко всем точкам корреляционного поля, т.е. практически через его центр.
В 1806г. французский математик Лежандр показал, что наилучшим образом будет отражать связь между переменными линия, для которой выполняется условие
, (3.8)
где – наблюдаемое (фактическое) значение случайной величины;– соответствующее расчетное среднее значение случайной величины.
Разность называется отклонением значения случайной величиныот соответствующего среднего значения. Уравнение (3.8) представляет собой математическую запись метода наименьших квадратов, в соответствии с которым коэффициенты регрессии определяют из условия минимума суммы квадратов отклонений.
Пусть имеем двумерную выборку результатов эксперимента, т.е. известны значения
Тогда и сумма (3.8) является функцией параметров
(3.9)
Необходимое условие минимума функции многих переменных заключается в равенстве нулю всех ее частных производных, т.е.
(3.10)
Раскроем скобки, произведем суммирование и переставим местами уравнения.
(3.11)
Делим на n
В итоге получаем
(3.12)
Решаем систему (3.12) методом подстановки. Для этого выражаем коэффициент bиз первого уравнения
(3.13)
и подставляем (3.13) во второе уравнение системы (3.12). После выполнения преобразований получим:
(3.14)
где – выборочный коэффициент корреляции;- выборочные стандартные отклонения случайных величин .
При определении коэффициентов линейной регрессиивыполнялась минимизация суммы (3.8), т.е. рассматривались отклонения по вертикали.
Запишем линейную регрессию
(3.15)
и соответствующую сумму квадратов отклонений
(3.16)
т.е. коэффициенты определяются в результате минимизации суммы квадратов отклонений по горизонтали:
(3.17)
Оценка точности (надежности) уравнений регрессии выполняется на основе регрессионных статистик (критериев): остаточной дисперсии, критерии Фишера (- статистика),- статистики Стьюдента и коэффициенте детерминации. Расчет критериев приведен в работе [10].
- Министерство образования и науки украины
- Третий модуль Тема 3. Корреляционно-регрессионный анализ данных наблюдений
- Последовательность проведения корреляционно-регрессионного анализа
- Введение в тему
- Последовательность проведения корреляционно-регрессионного анализа
- 3.2. Проверка данных статистического наблюдения на наличие выбросов
- 3.3. Общие сведения из корреляционно-регрессионного анализа
- 3.4. Форма корреляционной связи
- 3.5. Теснота корреляционной связи
- Проверка на тесноту связи
- 3.6. Сила корреляционной связи
- 3.7. Методикаполученияуравнений линейной регрессии в случае малых выборок Последовательность проведения регрессионного анализа
- Технологияопределения в среде эт коэффициентовлинейнойрегрессии в случае малых выборок
- Прогнозирование на основе полученной модели регрессии
- 3.8. Понятие о многомерном корреляционном анализе
- Определение Для расчета используем ту же матрицу третьего порядка. Расчет ведем по формуле:
- Коэффициент множественной корреляции
- 3.9. Создание математических моделей регрессии
- Парный нелинейный регрессионный анализ
- Экономический смысл коэффициентов регрессии
- Многомерный нелинейный регрессионный анализ
- 3.10. Методика получения уравнений парной линейной регрессии при большом объеме выборки
- 3.11. Понятие о мультиколлинеарности
- Тесты для самоконтроля
- Характеристика тестов темы 3:
- Контрольные задания