logo
МАТЕМАТИКА 5

42. Корреляция и регрессия.

Часто наблюдаемые величины находятся в более сложных зависимостях, чем функциональная. Подобного рода зависимости относят к корреляционным зависимостям.

Определение. Две случайные величины X и Y находятся в корреляционной зависимости, если каждому значению любой из этих величин соответствует определенное распределение вероятностей другой величины.

Определение. Условным математическим ожиданием дискретной случайной величины X при Y = y (y –определенное возможное значение Y) называют сумму произведений возможных значений X на их условные вероятности:

(1),

где - условная вероятность равенства при условии, что Y = y.

Для непрерывных величин , где - плотность вероятности случайной непрерывной величины X при условии Y = y.

Условное математическое ожидание есть функция от y: , которую называют функцией регрессии величины X на величину Y.

Уравнение называют уравнением регрессии X на Y, а линию на плоскости, соответствующую этому уравнению, называют линией регрессии.

Уравнение регрессии Y на X записывается в виде функции .

Определение. Если X и Y – независимые случайные величины, то

(2)

Если X и Y – не являются независимыми случайными величинами, то, вообще говоря, .

За меру зависимости двух случайных величин X и Y принимают безразмерную величину , определяемую соотношением

(3)

или более кратко соотношением (4), где , , , и называемую коэффициентом корреляции.

Определение. Случайные величины X и Y называют некоррелированными, если r = 0, и коррелированными, если .

Свойства коэффициента корреляции:

  1. Если X и Y – независимые случайные величины, то коэффициент корреляции равен 0. Обратное утверждение неверно.

  2. Если , то между случайными величинами X и Y имеет место функциональная, а именно линейная, зависимость.

  3. Коэффициент корреляции характеризует относительную величину отклонения математического ожидания произведения от произведения математических ожиданий , поэтому можно утверждать, что он характеризует тесноту зависимости между X и Y.

Прямые регрессии.

Определение. Корреляционная зависимость между случайными величинами X и Y называется линейной корреляцией, если обе функции регрессии и являются линейными. В этом случае обе линии регрессии являются прямыми; они называются прямыми регрессии.

Коэффициент называют коэффициентом регрессии Y на X и обозначают

(5).

Соответственно уравнение прямой регрессии Y на X имеет вид: .

С учетом коэффициента корреляции уравнения прямых регрессии можно записать в виде:

, (6).

Коэффициенты корреляции связаны с коэффициентами регрессии отношением:

(7).