2. Линейная корреляция. Уравнения прямых регрессии для парной корреляции
Данные о статистической зависимости между двумя переменными величинами удобно задавать в виде корреляционной таблицы:
| y1 | y2 | … | yj | … | ym | Всего: или ni |
x1 | n11 | n12 | … | n1j | … | n1m | n1 |
x2 | n21 | n22 | … | n2j | … | n2m | n2 |
… | … | … | … | … | … | … | … |
xi | ni1 | ni2 | … | nij | … | nim | ni |
… | … | … | … | … | … | … | … |
xl | nl1 | nl2 | … | nlj | … | nlm | nl |
Всего: или nj | n1 | n2 | … | nj | … | nm | n |
где: l – число интервалов по переменной X, m – число интервалов по переменной Y;
xi и yj – середины соответствующих интервалов;
nij – частоты пар (xi ; yj) ;
, ;
– объем выборки.
Определение 1. Корреляционная зависимость между случайными величинами Х и Y называется линейной корреляцией, если обе функции регрессии (x) и (y) являются линейными.
Этот вид корреляционной зависимости встречается довольно часто. В этом случае обе линии регрессии являются прямыми и называются прямыми регрессии.
Выведем уравнение прямой регрессии Y по X , т.е. найдем коэффициенты линейной функции (x)=aх+b.
Для этого применим метод наименьших квадратов, согласно которому неизвестные параметры a и b выбираются так, чтобы была минимальной сумма:
,
где групповые средние вычисляются по формулам:
.
Используя необходимое условие экстремума функции двух переменных, получаем систему нормальных уравнений для определения параметров линейной регрессии:
,
где соответствующие средние вычисляются по формулам:
, , , .
Решая систему нормальных уравнений, получаем:
, , где:
– выборочная дисперсия переменной X, – выборочная ковариация.
Коэффициент a в уравнении регрессии называется выборочным коэффициентом регрессии Y по X и обозначается yx. Итак,
Аналогично уравнение прямой регрессии X по Y имеет вид , где – выборочный коэффициент регрессии X по Y, показывающий, на сколько единиц в среднем изменяется переменная Х при увеличении переменной Y на одну единицу. Здесь есть выборочная дисперсия переменной Y, где .
- Тема 1: Случайные события. Классификация событий
- 2. Классическое определение вероятности. Свойства вероятности события
- 3. Статистическое определение вероятности события и условия его применимости
- Лекция 2 Тема 2: Основные теоремы
- 1. Сумма событий. Теорема сложения вероятностей и её следствия
- 2. Зависимые и независимые события. Произведение событий. Условная вероятность. Теорема умножения вероятностей
- 3. Формула полной вероятности. Формула Байеса
- Лекция 3 Тема 3: Повторные независимые испытания Тема 4: Дискретные случайные величины
- 1. Повторные независимые испытания. Формула Бернулли
- 2. Асимптотическая формула Пуассона и условия ее применимости
- 3. Локальная теорема Муавра-Лапласа и условия ее применимости
- 4. Интегральная теорема Муавра-Лапласа, её следствия и условия их применимости
- 5. Понятие случайной величины и ее описание. Дискретная случайная величина и ее закон (ряд) распределения.
- Лекция 4 Тема 4: Дискретные случайные величины
- 1. Математические операции над дискретными случайными величинами
- 2. Математическое ожидание, дисперсия и среднее квадратическое отклонение дискретной случайной величины, их свойства
- 3. Математическое ожидание и дисперсия числа m и частости m/n наступлений события в п повторных независимых испытаниях
- 4. Биномиальный закон распределения и закон Пуассона
- Лекция 5 Тема 5: Непрерывные случайные величины. Нормальный закон распределения
- 1. Функция распределения случайной величины, ее свойства и график
- 2. Непрерывная случайная величина (нсв). Плотность вероятности нсв, ее определение и свойства
- 3. Равномерный (прямоугольный) закон распределения и его числовые характеристики.
- Лекция 6 Тема 5: Непрерывные случайные величины. Нормальный закон распределения
- 1. Нормальный закон распределения
- 2. Формулы для определения вероятностей: а) попадания нормально распределенной случайной величины в заданный интервал; б) ее отклонения от математического ожидания. Правило трех сигм
- 3. Центральная предельная теорема. Понятие о теореме Ляпунова
- Лекция 7 Тема 6: Двумерные (n-мерные) случайные величины
- 1. Понятие двумерной (n-мерной) случайные величины
- 2. Условные распределения и их нахождение по таблице распределения
- 3. Понятие о функции распределения и плотности вероятности двумерной случайной величины
- 4. Ковариация и коэффициент корреляции
- Лекция 8 Тема 6: Двумерные (n-мерные) случайные величины Тема 7: Закон больших чисел
- 1. Двумерное нормальное распределение. Условное математическое ожидание и условная дисперсия
- 2. Лемма Чебышева (неравенство Маркова) Неравенство Чебышева и его частные случаи для случайной величины, распределенной по биномиальному закону, и для частости события
- 3. Неравенство Чебышева для средней арифметической случайных величин. Теорема Чебышева и ее значение
- 4. Закон больших чисел. Теорема Бернулли и ее практическое значение
- Лекция 9 Тема 8. Выборочный метод. Общие вопросы
- 1. Вариационный ряд, его разновидности. Средняя арифметическая и дисперсия ряда
- 2. Генеральная и выборочная совокупности. Основная задача выборочного метода
- 3. Понятие об оценке параметров генеральной совокупности. Свойства оценок: несмещенность, состоятельность, эффективность
- Лекция 10 Тема 9: Оценка доли признака и генеральной средней
- 1. Оценка генеральной доли и генеральной средней по собственно-случайной выборке. Несмещенность и состоятельность оценок
- 2. Оценка генеральной средней по собственно-случайной выборке
- 2. Оценка генеральной дисперсии по собственно-случайной выборке. Исправленная выборочная дисперсия
- 3. Понятие доверительного интервала и доверительной вероятности оценки
- 4. Средняя квадратическая ошибка выборки при оценке генеральной доли и генеральной средней
- 5. Определение необходимого объема повторной и бесповторной выборок
- Лекция 11 Тема 10: Элементы статистической проверки гипотез
- 1. Статистическая гипотеза и статистический критерий
- 2. Построение теоретического закона распределения по опытным данным. Понятие о критериях согласия
- 3. Критерий согласия 2 Пирсона и схема его применения
- Лекция 12 Тема 11: Элементы теории корреляции
- 1. Функциональная, статистическая и корреляционная зависимости. Основные задачи теории корреляции
- 2. Линейная корреляция. Уравнения прямых регрессии для парной корреляции
- 3. Оценка тесноты связи. Коэффициент корреляции (выборочный), его определение и свойства
- 4. Коэффициент детерминации и корреляционное отношение.
- 5. Проверка значимости уравнения регрессии