logo
Моделирование / Lektsii_Metody_modelirovania_i_prognozirovania

Отбор факторов для регрессии

Различают содержательный и формальный отбор. С содержательной точки зрения в перечень факторов включаются причины изучаемого явления (напр., причиной выпуска продукции является наличие работников). Однако причина может быть представлена различными видами рядов (напр., наличие работников м.б. описано средней численностью, фондом зарплаты, средним стажем, фондом рабочего времени) и различными формами представления (абсолютные, относительные, приростные значения). Кроме того, влияние причины может запаздывать во времени (напр., увеличение основных фондов сейчас, вызовет прирост производства позднее), что приводит к рассмотрению сдвинутых (на период запаздывания) рядов-факторов.. Т.о., одна причина даёт множество рядов-факторов.

С формальной точки зрения, лучшими факторами являются те, что больше похожи по своим колебаниям на изучаемый ряд, т.е. наиболее коррелирующие с ним. Т.о., из всех рядов-факторов в уравнение регрессии целесообразно включать факторы с наибольшими (по модулю) коэффициентами корреляции [с изучаемым рядом].

Отбор факторов можно начать и с формального способа – оценить корреляцию с изучаемым рядом всех доступных исследователю рядов. Высокая корреляция служит сигналом того, что соответствующее явление может быть ранее неизвестной причиной изучаемого явления.

Регрессия – это математическая функция от ряда содержательных переменных, каждая из которых зависит от времени, и времени:

Если содержательные переменные убрать, получим зависимость только от времени, т.е. тренд. Тренд – регрессия ко времени.

Фактор времени [самого по себе] представляет совокупное влияние всех прочих причин, не нашедших отражение в модели. Если уравнения регрессий с и без фактора времени существенно расходятся – в перечне факторов пропущены существенные (поиск которых – задача содержательного исследования).