4. Ковариация и коэффициент корреляции
Две дискретные случайные величины называются независимыми, если закон распределения одной из них не зависит от того, какое конкретное значение приняла вторая случайная величина. Теперь можно дать общее определение независимости непрерывных случайных величин Х и У.
Определение 1. Случайные величины Х и У называются независимыми, если их совместную функцию распределения F(х,у) можно представить в виде произведения двух функций распределения F1(x) и F2(y) этих случайных величин, т.е.
F(х,у) = F1(x) F2(y).
Если равенство не выполняется, то случайные величины называются зависимыми.
При изучении двумерных случайных величин иногда достаточно знать числовые характеристики их одномерных составляющих Х и У: математические ожидания и дисперсии, которые вычисляются по формулам:
ах = М(Х) = х (х,у)dxdy,
ау = М(У) = у (х,у)dxdy,
D(Х) = (х- ах )2 (х,у)dxdy,
D(У) = (у- ау )2 (х,у)dxdy.
Для определения степени зависимости между случайными величинами Х и У, вычисляют ковариацию и коэффициент корреляции.
Определение 2. Ковариацией (или корреляционным моментом) Кху случайных величин Х и У называют математическое ожидание произведения отклонений этих величин от своих математических ожиданий, т.е.
Кху = М[(Х – М(Х))(У – М(У))] = М[Х - ах)(У - ау)].
Из определения следует, что Кху = Кух.
Последняя формула принимает вид:
а) для дискретных случайных величин:
Кху = (xi - ах)(yj - ау)pij ;
б) для непрерывных случайных величин:
Кху = (х - ах)(у - ау) (х,у)dxdy.
Ковариация двух случайных величин характеризует как степень зависимости между ними, так и их рассеяние вокруг точки (ах, ау). Об этом же свидетельствуют свойства ковариации случайных величин.
1. Ковариация двух независимых случайных величин равна нулю.
2. Ковариация двух случайных величин равна математическому ожиданию их произведения без произведения их математических ожиданий, т.е.
Кху = М(ХУ) – М(Х)М(У) = М(ХУ) - ах ау.
3. Ковариация двух случайных величин по модулю не превосходит произведения их средних квадратических отклонений, т.е.
≤ х у.
Ковариация величина размерная и определяется размерностью случайных величин. Это затрудняет использование ковариации для оценки степени зависимости для различных случайных величин. Этих недостатков лишён коэффициент корреляции.
Определение 3. Коэффициентом корреляции двух случайных величин называют отношение ковариации к произведению их средних квадратических отклонений:
ху = .
Из определения следует, что ху = ух = и коэффициент корреляции – величина безразмерная.
Основные свойства коэффициента корреляции.
1. Коэффициент корреляции по модулю не превосходит единицу, т.е.
-1 ≤ ≤ 1.
2. Если случайные величины независимы, то их коэффициент корреляции равен нулю, т.е. = 0.
Случайные величины называются некоррелированными, если их коэффициент корреляции равен нулю. Итак, из независимости случайных величин следует их некоррелированность.
Обратное утверждение, вообще говоря, неверное: из некоррелированности двух случайных величин ещё не следует их независимость.
3. Если коэффициент корреляции двух случайных величин равен 1 (по модулю), то между ними существует линейная функциональная зависимость.
- Тема 1: Случайные события. Классификация событий
- 2. Классическое определение вероятности. Свойства вероятности события
- 3. Статистическое определение вероятности события и условия его применимости
- Лекция 2 Тема 2: Основные теоремы
- 1. Сумма событий. Теорема сложения вероятностей и её следствия
- 2. Зависимые и независимые события. Произведение событий. Условная вероятность. Теорема умножения вероятностей
- 3. Формула полной вероятности. Формула Байеса
- Лекция 3 Тема 3: Повторные независимые испытания Тема 4: Дискретные случайные величины
- 1. Повторные независимые испытания. Формула Бернулли
- 2. Асимптотическая формула Пуассона и условия ее применимости
- 3. Локальная теорема Муавра-Лапласа и условия ее применимости
- 4. Интегральная теорема Муавра-Лапласа, её следствия и условия их применимости
- 5. Понятие случайной величины и ее описание. Дискретная случайная величина и ее закон (ряд) распределения.
- Лекция 4 Тема 4: Дискретные случайные величины
- 1. Математические операции над дискретными случайными величинами
- 2. Математическое ожидание, дисперсия и среднее квадратическое отклонение дискретной случайной величины, их свойства
- 3. Математическое ожидание и дисперсия числа m и частости m/n наступлений события в п повторных независимых испытаниях
- 4. Биномиальный закон распределения и закон Пуассона
- Лекция 5 Тема 5: Непрерывные случайные величины. Нормальный закон распределения
- 1. Функция распределения случайной величины, ее свойства и график
- 2. Непрерывная случайная величина (нсв). Плотность вероятности нсв, ее определение и свойства
- 3. Равномерный (прямоугольный) закон распределения и его числовые характеристики.
- Лекция 6 Тема 5: Непрерывные случайные величины. Нормальный закон распределения
- 1. Нормальный закон распределения
- 2. Формулы для определения вероятностей: а) попадания нормально распределенной случайной величины в заданный интервал; б) ее отклонения от математического ожидания. Правило трех сигм
- 3. Центральная предельная теорема. Понятие о теореме Ляпунова
- Лекция 7 Тема 6: Двумерные (n-мерные) случайные величины
- 1. Понятие двумерной (n-мерной) случайные величины
- 2. Условные распределения и их нахождение по таблице распределения
- 3. Понятие о функции распределения и плотности вероятности двумерной случайной величины
- 4. Ковариация и коэффициент корреляции
- Лекция 8 Тема 6: Двумерные (n-мерные) случайные величины Тема 7: Закон больших чисел
- 1. Двумерное нормальное распределение. Условное математическое ожидание и условная дисперсия
- 2. Лемма Чебышева (неравенство Маркова) Неравенство Чебышева и его частные случаи для случайной величины, распределенной по биномиальному закону, и для частости события
- 3. Неравенство Чебышева для средней арифметической случайных величин. Теорема Чебышева и ее значение
- 4. Закон больших чисел. Теорема Бернулли и ее практическое значение
- Лекция 9 Тема 8. Выборочный метод. Общие вопросы
- 1. Вариационный ряд, его разновидности. Средняя арифметическая и дисперсия ряда
- 2. Генеральная и выборочная совокупности. Основная задача выборочного метода
- 3. Понятие об оценке параметров генеральной совокупности. Свойства оценок: несмещенность, состоятельность, эффективность
- Лекция 10 Тема 9: Оценка доли признака и генеральной средней
- 1. Оценка генеральной доли и генеральной средней по собственно-случайной выборке. Несмещенность и состоятельность оценок
- 2. Оценка генеральной средней по собственно-случайной выборке
- 2. Оценка генеральной дисперсии по собственно-случайной выборке. Исправленная выборочная дисперсия
- 3. Понятие доверительного интервала и доверительной вероятности оценки
- 4. Средняя квадратическая ошибка выборки при оценке генеральной доли и генеральной средней
- 5. Определение необходимого объема повторной и бесповторной выборок
- Лекция 11 Тема 10: Элементы статистической проверки гипотез
- 1. Статистическая гипотеза и статистический критерий
- 2. Построение теоретического закона распределения по опытным данным. Понятие о критериях согласия
- 3. Критерий согласия 2 Пирсона и схема его применения
- Лекция 12 Тема 11: Элементы теории корреляции
- 1. Функциональная, статистическая и корреляционная зависимости. Основные задачи теории корреляции
- 2. Линейная корреляция. Уравнения прямых регрессии для парной корреляции
- 3. Оценка тесноты связи. Коэффициент корреляции (выборочный), его определение и свойства
- 4. Коэффициент детерминации и корреляционное отношение.
- 5. Проверка значимости уравнения регрессии