Коэффициент множественной корреляции
Часто представляет интерес оценить связь одного из признаков со всеми остальными. Делается это с помощью коэффициента множественной корреляции
(3.27)
где - определитель корреляционной матрицы- алгебраическое дополнение к элементу
Оценкой коэффициента множественной корреляции является выборочный коэффициент множественной корреляции, определяемый по формуле
(3.28)
где - определитель корреляционной матрицы- алгебраическое дополнение к элементуКвадраты соответствующих коэффициентов множественной корреляции называют коэффициентами множественной детерминации и обозначают соответственно
Детерминация выражает долю дисперсии в исследуемом признаке, связанную с дисперсией в остальных признаках. Например, исследуется зависимость рентабельностипредприятия от признака- «премии и вознаграждения» и получено=0,458. Это означает, что примерно 45,8% меры изменчивости рентабельности связано с мерой изменчивости признака «премии и вознаграждения». В случае исследования трех переменных и более, как правило,>и показывает, что когда оптимальным образом соединяются остальные признаки в соответствии с уравнением регрессии, то это оказывает благотворное влияние на результативный признак. Рис.3.6 представляет геометрический смысл коэффициента детерминации.
Рис. 3.6. Геометрический смысл коэффициента детерминации
Пример 3.7. Определить оценки коэффициентов множественной корреляции и детерминации первого признака со всеми остальными, используя данные примера 3.6.
Расчетная формула в этом случае имеет вид:
Результаты расчета в среде ЭТ представлены в таблице 3.12.
Статистическую значимость коэффициентов множественной корреляции и детерминации проверяют с помощью критерия Фишера. Проверяется нулевая гипотеза Для этого вычисляют статистику, имеющую- распределение сстепенями свободы (- число фиксированных признаков).
Таблица 3.12. Результаты расчета
По приложению 2 [10] находят критическое значение критерия Фишера. Если расчетное значение критерия Фишера больше критического, то нулевая гипотеза отвергается. В противном случае нет причин отвергнуть нулевую гипотезу.
Для рассматриваемого примера Нулевая гипотеза отвергается. Следовательно, можно говорить о корреляционной связи признакас остальными признаками.
Пример 3.8. Для многомерной выборки объектов недвижимости получена корреляционная матрица, представленная в таблице 3.13. Обозначения в этой таблице:
- стоимость 1м2 внутренней площади, у.е.;
- величина физического износа, %;
- доля подвальных помещений в общей площади;
- стоимость улучшений на 1м2 внутренней площади, у.е.
Таблица 3.13. Корреляционная матрица
| ||||
1 | -0,47691 | -0,26374 | 0,560895 | |
-0,47691 | 1 | -0,00362 | -0,57971 | |
-0,26374 | -0,00362 | 1 | 0,051953 | |
0,560895 | -0,57971 | 0,051953 | 1 |
Определить выборочные частные коэффициенты корреляции результативного признака с каждым факторным признаком и коэффициенты множественной корреляции и детерминации.
Решение. Расчетные формулы в данном случае имеют вид:
В таблице 3.14 приведены результаты расчета в среде ЭТ.
Сравнение частных коэффициентов корреляции с соответствующими коэффициентами парной корреляции показывает, например, что в парной корреляции между стоимостью 1 м2 и величиной износа высока доля влияния остальных признаков, так как частный коэффициент корреляции меньше парного (). Это можно объяснить тем, что среди зданий с высоким уровнем износа в выборке чаще встречаются подвальные помещения, на реставрацию которых мало кто желает вкладывать средства.
Величина коэффициента множественной корреляции показывает, что наблюдается заметная связь между стоимостью 1 м2 внутренней площади недвижимости и показателями уровня износа, доли подвальных помещений в общей площади, стоимости улучшений на 1 м2 . Коэффициент множественной детерминации показывает, что только 43,2% общей дисперсии стоимости 1 м2 внутренней площади недвижимости объясняется влиянием исследуемых факторных признаков. Следовательно, в математической модели регрессии не учтены еще важные факторные признаки.
Таблица 3.14. Результаты расчета
- Министерство образования и науки украины
- Третий модуль Тема 3. Корреляционно-регрессионный анализ данных наблюдений
- Последовательность проведения корреляционно-регрессионного анализа
- Введение в тему
- Последовательность проведения корреляционно-регрессионного анализа
- 3.2. Проверка данных статистического наблюдения на наличие выбросов
- 3.3. Общие сведения из корреляционно-регрессионного анализа
- 3.4. Форма корреляционной связи
- 3.5. Теснота корреляционной связи
- Проверка на тесноту связи
- 3.6. Сила корреляционной связи
- 3.7. Методикаполученияуравнений линейной регрессии в случае малых выборок Последовательность проведения регрессионного анализа
- Технологияопределения в среде эт коэффициентовлинейнойрегрессии в случае малых выборок
- Прогнозирование на основе полученной модели регрессии
- 3.8. Понятие о многомерном корреляционном анализе
- Определение Для расчета используем ту же матрицу третьего порядка. Расчет ведем по формуле:
- Коэффициент множественной корреляции
- 3.9. Создание математических моделей регрессии
- Парный нелинейный регрессионный анализ
- Экономический смысл коэффициентов регрессии
- Многомерный нелинейный регрессионный анализ
- 3.10. Методика получения уравнений парной линейной регрессии при большом объеме выборки
- 3.11. Понятие о мультиколлинеарности
- Тесты для самоконтроля
- Характеристика тестов темы 3:
- Контрольные задания