Тема 11. Элементы теории корреляции
В теме 11 рассматриваются «Элементы теории корреляции», основными задачами которой являются установление формы, изучение зависимости и выявление тесноты связи между случайными переменными.
В дисциплине «Математический анализ и линейная алгебра» мы изучали функциональную зависимость между двумя переменными, когда каждому значению одной переменной соответствует вполне определенное значение другой. Например, зависимость между двумя случайными переменными – числом вышедших из строя единиц оборудования за определенный период времени и их стоимостью – функциональная.
В экономике в большинстве случаев между переменными существуют зависимости, когда каждому значению одной переменной соответствует не какое-то определенное, а множество возможных значений другой переменной. Иначе говоря, каждому значению одной переменной соответствует определенное (условное) распределение другой переменной. Такая зависимость или связь получила название статистической (вероятностной, стохастической) . Примером статистической связи является зависимость урожайности от количества внесенных удобрений, зависимости производительности труда на предприятии от его энерговооруженности и т.п.
В силу неоднозначности статистической зависимости представляет интерес закономерность в изменении среднего значения переменнойY при данном значении переменной х в зависимости от х, т.е. условного математического ожидания переменнойY при данном х в зависимости от х.
Корреляционной зависимостью между двумя переменными величинами называется функциональная зависимость между значениями одной из них и условным математическим ожиданием другой.
Оценкой корреляционной зависимости по выборке является уравнение регрессии, представляющее функциональную зависимость между групповой (условной) средней одной переменной и значениями другой.
Функциональная зависимость между переменными (при которой каждому х однозначно соответствует свой у) является частным случаем корреляционной зависимости (при которой каждому х соответствует свое условное среднее значение у) Корреляционная же зависимость, в свою очередь, является частным случаем статистической (при которой каждому х соответствует свое условное распределение у).
Конечная цель корреляционного анализа – получение уравнений прямых регрессий, характеризующих форму зависимости, и вычисление коэффициента корреляции, определяющего тесноту (силу) связи, если она линейная.
Расчет производится в два основных этапа. На первом обрабатывают табличные данные для нахождения средних значений переменных ,, их дисперсий,иковариации , равной разности между средним значением произведения переменных и произведением их средних. При этом рекомендуется использовать упрощенный способ их расчета (§12.2).
Второй этап – вычисление основных характеристик корреляционной зависимости: коэффициентов регрессии и корреляции. Коэффициенты регрессии, являясь угловыми коэффициентами прямых регрессий (в случае линейной корреляционной зависимости), показывают, на сколько единиц в среднем изменяется зависимая переменная при изменении другой переменной на одну единицу.
Для изучения тесноты линейной корреляционной зависимости используется коэффициент корреляции, показывающий, на сколько в среднем своих стандартных отклонений изменится переменнаяY при изменении переменнойX на ее стандартное отклонение .
Коэффициент корреляции есть средняя геометрическая коэффициентов регрессии , при этом равен корню квадратному из произведения коэффициентов регрессии, который берется с их знаком.
Нужно четко знать, что коэффициент корреляции r принимает значения на отрезке от 1 до 1, при этом, чем ближе к единице, тем теснее связь. Коэффициент корреляции не зависит от единиц измерения переменных. Если , то корреляционная связь представляет линейную функциональную зависимость и линии регрессии сливаются. Еслито линейная корреляционная зависимость отсутствует и линии регрессии параллельны осям координат. В этом случае переменные называютсянекоррелированными. И если из независимости переменных естественным образом вытекает их некоррелированность, то обратное утверждение, вообще говоря, неверно: из некоррелированности двух случайных величин не следует их независимость.
В заключение данной лекции следует отметить, что в ней не ставилась и не могла ставиться задача детального изучения курса. Настоящая лекция является лишь первым шагом, навигатором на пути освоения данной дисциплины. Разрешите пожелать Вам успехов на этом нелегком пути познания!
Благодарю за внимание.
- Теория вероятностей и математическая статистика. Обзорная лекция
- Вводная часть
- Раздел 1. Теория вероятностей
- Тема 1. Классификация событий
- Тема 2. Основные теоремы
- Тема 3. Повторные независимые испытания
- Тема 4. Дискретная случайная величина и ее числовые характеристики
- Тема 5. Непрерывные случайные величины. Нормальный закон распределения
- Тема 6. Двумерные ( n – мерные ) случайные величины
- Тема 7. Закон больших чисел
- Раздел 2. Математическая статистика
- Тема 8. Вариационные ряды
- Тема 9. Основы выборочного метода
- Тема 10. Элементы проверки статистических гипотез
- Тема 11. Элементы теории корреляции