Корреляционный анализ
Определение формы связи
Изучение взаимосвязей между признаками статистической совокупности заключается в определении формы и количественной характеристики связи, а также степени тесноты связи. Корреляционный анализ и решает эти две основные задачи.
Первая задача заключается в определении формы связи, т.е. в установлении математической формы, в которой выражается данная связь.
Предварительный этап при установлении формы связи заключается в теоретическом анализе изучаемого явления, а также в представлении искомой связи графически. График, построенный по исходным данным, позволяет приблизительно определить: есть ли какая-то связь между явлениями; ее направление (прямая или обратная); примерную тесноту связи (естественно, что при графическом анализе используютсятолько две переменные).
Применение методов корреляционного анализа дает возможность выражать связь между признаками аналитически - в виде уравнения - и придавать ей количественное выражение.
Другими словами необходимо найти зависимость вида y=f(x),причем в качестве функции f(x) могут быть
полином 1-го порядка-
полином 2-го порядка -
степенная функция -
гиперболическая функция -
(могут быть использованы и другие виды функций).
Неизвестные параметры функций (аналитических уравнений связи) находятся методом наименьших квадратов, сущность которого в следующем: сумма квадратов отклонений фактических данных от выровненных должна быть наименьшей (см. рисунок):
или
Отклонение фактических уровней от выровненных
y
x
Ù
y
Измерение тесноты связи
При изучении корреляционной связи важно выяснить не только форму, но и тесноту связи между факторным и результативным признаком. Для этого (при прямолинейной связи) рассчитывается показатель, называемый парным линейным коэффициентом корреляции , вычисляемый по формуле
.
Коэффициент корреляции принимает значение от -1 до +1, причем если >0, то корреляция прямая, если<0, то корреляция обратная, а если=0, то корреляция отсутствует полностью.
В зависимости от того, насколько приближается к единице, различают связь слабую, умеренную, заметную, высокую, тесную и весьма тесную.
Коэффициент корреляции может быть исчислен и по следующей формуле ,
где - среднее квадратическое отклонение результативного признака;
- среднее квадратическое отклонение факторного признака.
Зная линейный коэффициент корреляции, можно определить и параметры уравнения регрессии вида потому что:
.
Коэффициент корреляции применяется только в тех случаях, когда между явлениями существует прямолинейная связь. Если же связь криволинейная, то пользуются коэффициентом корреляции, вычисляемым по формуле
,
где y- исходные значения результативного показателя;
-теоретические значения;
-среднее значение y.
Имея среднее значение дисперсий, коэффициент корреляции можно вычислить как
,
где - факторная (межгрупповая) дисперсия или дисперсия воспроизводимости;
- случайная (средняя из внутригрупповых) дисперсия или остаточная дисперсия; - общая дисперсия.
Коэффициент корреляции по своему абсолютному значению находится в пределах от 0 до 1.
Если коэффициент корреляции возвести в квадрат и выразить в процентах, получим показатель, называемый коэффициентом детерминации
D=R2∙100%.
Он показывает, на сколько процентов изменение результативного фактора зависит от изменения факторного признака. Коэффициент детерминации является наиболее конкретным показателем, так как он отвечает на вопрос о том, какая доля в общем результате зависит от фактора, положенного в основании группировки.
Примерные вопросы для собеседования
Ряды распределения: понятие, виды, элементы. Графическое изображение рядов распределения.
Выборочный метод: причины применения, решаемые задачи. Выборочная совокупность: способы отбора, виды выборки, ошибка выборки.
Корреляционно-регрессионный анализ (КРА): понятие, условия применения, задачи КРА.
Вычисление и интерпретация параметров парной линейной корреляции.
Тематика, выносимая на самостоятельное изучение (в объеме 9 часов):
Показатели вариации и способы их расчета.
Определение необходимой численности выборки
Множественная корреляция.
Методы измерения тесноты связи.
Пример комплекта заданий для контрольной работы по темам модуля 1
- Учебно-методический комплекс дисциплины
- Тема 2 «Методика проведения экономико-статистического исследования. Статистическое наблюдение» (16 часов, 0,44 зет)
- 2. Задачи:
- 3.Задание.
- 4. Защита результатов лабораторной работы.
- Тема 3 «Сводка и группировка статистических данных№ (18 часов, 0,5 зет)
- 2. Задачи:
- 3.Задание.
- 4. Защита результатов лабораторной работы.
- Тема 4 «Метод обобщений» (18 часов 0,5 зет)
- 1. Цель.
- 2. Задачи:
- 3.Задание.
- 4. Защита результатов лабораторной работы.
- Тема 5 «Ряды динамики и их анализ» (16 часов, 0,44 зет)
- 1. Цель.
- 2. Задачи:
- 3.Задание.
- 4. Защита результатов лабораторной работы.
- Тема 5» Индексный метод» (15 часов, 0,42 зет)
- Индексы количественных показателей
- Индивидуальный индекс стоимости продукции:
- Индексы качественных показателей
- Iпокуп.Спос. – 1 : Ip
- Тема 7. «Ряды распределения. Выборочный метод. Корреляция и регрессия» (13 часов, 0,36 зет)
- Ряды распределения: сущность, виды, элементы.
- Общие сведения о выборочном наблюдении
- Виды и схемы отбора
- Определение средних и предельных ошибок при различных видах отбора
- Виды и формы взаимосвязи между явлениями
- Основные приемы изучения взаимосвязей
- Корреляционный анализ
- Вариант 1
- Тема 8 «Система национального счетоводства (снс)» (18 часов, 0,5 зет)
- Основные категории, определения и принципы построения системы национальных счетов
- Классификация счетов
- Тема 9 «Статистика национального богатства» (16 часов, 0,44 зет)
- Баланс основных фондов по полной (первоначальной или восстановительной) стоимости, млн руб.
- Баланс основных фондов по остаточной стоимости (первоначальной или восстановительной с учетом износа), млн руб.
- Тема 10 «Статистика социального развития: численности и состава населения, трудовых ресурсов, уровня жизни» (16 часов, 0,55 зет)
- Статистика численности и состав населения
- Статистика уровня жизни населения
- Тема 11 «Статистика финансов» (18 часов, 0,5 зет)
- 1. Цель.
- 2. Задачи:
- 3.Задание.
- 4. Защита результатов лабораторной работы.
- Вопрос 1
- Вопросы для подготовки к экзамену
- Список литературы
- А) нормативная литература
- Федеральный закон от 29 ноября 2007 г. N 282-фз "Об официальном статистическом учете и системе государственной статистики в Российской Федерации"//Консультант Плюс.
- Б) основная учебная литература
- В) дополнительная учебная литература
- Глоссарий терминов