Тема 11. Элементы теории корреляции
В теме 11 рассматриваются «Элементы теории корреляции», основными задачами которой являются установление формы, изучение зависимости и выявление тесноты связи между случайными переменными.
В дисциплине «Математический анализ и линейная алгебра» мы изучали функциональную зависимость между двумя переменными, когда каждому значению одной переменной соответствует вполне определенное значение другой. Например, зависимость между двумя случайными переменными – числом вышедших из строя единиц оборудования за определенный период времени и их стоимостью – функциональная.
В экономике в большинстве случаев между переменными существуют зависимости, когда каждому значению одной переменной соответствует не какое-то определенное, а множество возможных значений другой переменной. Иначе говоря, каждому значению одной переменной соответствует определенное (условное) распределение другой переменной. Такая зависимость или связь получила название статистической (вероятностной, стохастической) . Примером статистической связи является зависимость урожайности от количества внесенных удобрений, зависимости производительности труда на предприятии от его энерговооруженности и т.п.
В силу неоднозначности статистической зависимости представляет интерес закономерность в изменении среднего значения переменнойY при данном значении переменной х в зависимости от х, т.е. условного математического ожидания переменнойY при данном х в зависимости от х.
Корреляционной зависимостью между двумя переменными величинами называется функциональная зависимость между значениями одной из них и условным математическим ожиданием другой.
Оценкой корреляционной зависимости по выборке является уравнение регрессии, представляющее функциональную зависимость между групповой (условной) средней одной переменной и значениями другой.
Функциональная зависимость между переменными (при которой каждому х однозначно соответствует свой у) является частным случаем корреляционной зависимости (при которой каждому х соответствует свое условное среднее значение у) Корреляционная же зависимость, в свою очередь, является частным случаем статистической (при которой каждому х соответствует свое условное распределение у).
Конечная цель корреляционного анализа – получение уравнений прямых регрессий, характеризующих форму зависимости, и вычисление коэффициента корреляции, определяющего тесноту (силу) связи, если она линейная.
Расчет производится в два основных этапа. На первом обрабатывают табличные данные для нахождения средних значений переменных ,, их дисперсий,иковариации , равной разности между средним значением произведения переменных и произведением их средних. При этом рекомендуется использовать упрощенный способ их расчета (§12.2).
Второй этап – вычисление основных характеристик корреляционной зависимости: коэффициентов регрессии и корреляции. Коэффициенты регрессии, являясь угловыми коэффициентами прямых регрессий (в случае линейной корреляционной зависимости), показывают, на сколько единиц в среднем изменяется зависимая переменная при изменении другой переменной на одну единицу.
Для изучения тесноты линейной корреляционной зависимости используется коэффициент корреляции, показывающий, на сколько в среднем своих стандартных отклонений изменится переменнаяY при изменении переменнойX на ее стандартное отклонение .
Коэффициент корреляции есть средняя геометрическая коэффициентов регрессии , при этом равен корню квадратному из произведения коэффициентов регрессии, который берется с их знаком.
Нужно четко знать, что коэффициент корреляции r принимает значения на отрезке от 1 до 1, при этом, чем ближе к единице, тем теснее связь. Коэффициент корреляции не зависит от единиц измерения переменных. Если , то корреляционная связь представляет линейную функциональную зависимость и линии регрессии сливаются. Еслито линейная корреляционная зависимость отсутствует и линии регрессии параллельны осям координат. В этом случае переменные называютсянекоррелированными. И если из независимости переменных естественным образом вытекает их некоррелированность, то обратное утверждение, вообще говоря, неверно: из некоррелированности двух случайных величин не следует их независимость.
В заключение данной лекции следует отметить, что в ней не ставилась и не могла ставиться задача детального изучения курса. Настоящая лекция является лишь первым шагом, навигатором на пути освоения данной дисциплины. Разрешите пожелать Вам успехов на этом нелегком пути познания!
Благодарю за внимание.
Yandex.RTB R-A-252273-3
- Теория вероятностей и математическая статистика. Обзорная лекция
- Вводная часть
- Раздел 1. Теория вероятностей
- Тема 1. Классификация событий
- Тема 2. Основные теоремы
- Тема 3. Повторные независимые испытания
- Тема 4. Дискретная случайная величина и ее числовые характеристики
- Тема 5. Непрерывные случайные величины. Нормальный закон распределения
- Тема 6. Двумерные ( n – мерные ) случайные величины
- Тема 7. Закон больших чисел
- Раздел 2. Математическая статистика
- Тема 8. Вариационные ряды
- Тема 9. Основы выборочного метода
- Тема 10. Элементы проверки статистических гипотез
- Тема 11. Элементы теории корреляции