logo search
11_Конспекты лекций

2. Линейная корреляция. Уравнения прямых регрессии для парной корреляции

Данные о статистической зависимости между двумя переменными величинами удобно задавать в виде корреляционной таблицы:

y1

y2

yj

ym

Всего:

или ni

x1

n11

n12

n1j

n1m

n1

x2

n21

n22

n2j

n2m

n2

xi

ni1

ni2

nij

nim

ni

xl

nl1

nl2

nlj

nlm

nl

Всего:

или nj

n1

n2

nj

nm

n

где: l – число интервалов по переменной X, m – число интервалов по переменной Y;

xi и yj – середины соответствующих интервалов;

nij – частоты пар (xi ; yj) ;

, ;

– объем выборки.

Определение 1. Корреляционная зависимость между случайными величинами Х и Y называется линейной корреляцией, если обе функции регрессии (x) и (y) являются линейными.

Этот вид корреляционной зависимости встречается довольно часто. В этом случае обе линии регрессии являются прямыми и называются прямыми регрессии.

Выведем уравнение прямой регрессии Y по X , т.е. найдем коэффициенты линейной функции (x)=aх+b.

Для этого применим метод наименьших квадратов, согласно которому неизвестные параметры a и b выбираются так, чтобы была минимальной сумма:

,

где групповые средние вычисляются по формулам:

.

Используя необходимое условие экстремума функции двух переменных, получаем систему нормальных уравнений для определения параметров линейной регрессии:

,

где соответствующие средние вычисляются по формулам:

, , , .

Решая систему нормальных уравнений, получаем:

, , где:

– выборочная дисперсия переменной X, – выборочная ковариация.

Коэффициент a в уравнении регрессии называется выборочным коэффициентом регрессии Y по X и обозначается yx. Итак,

Аналогично уравнение прямой регрессии X по Y имеет вид , где – выборочный коэффициент регрессии X по Y, показывающий, на сколько единиц в среднем изменяется переменная Х при увеличении переменной Y на одну единицу. Здесь есть выборочная дисперсия переменной Y, где .