Регресійний аналіз інтервальних даних

дипломная работа

Розділ І. Лінійна багатовимірна регресія

Нехай- деяка випадкова величина, флуктує навколо деякого невідомого значення параметра , тобто , де- флуктуація або похибка. Наприклад, похибка може бути властива самому експерименту, або похибка може виникати при вимірювані невідомого параметра .

Припустимо тепер, що можна представити у вигляді

де - відомі постійні величини, а - невідомі параметри, які потрібно оцінити.

Якщо величина змінюється і при цьому змінна набуває значень , тобто можна записати

(1.1)

У матричному вигляді, отримаємо:

Або

(1.2)

де .

Означення: Матриця розміру називається регресійною матрицею. При цьому її елементи обираються таким чином, щоб , тобто число лінійних незалежних стовпців дорівнювало , також матрицю називають матрицею повного рангу.

Але в деяких випадках приймає лише два значення 0, 1, тоді можливі випадки коли в матриці деякі рядки або стовпці збігаються, тобто є лінійно - залежними. В цьому випадку називають матрицею плану. Змінні називають регресорами (j=1,…,p-1), або предикторними змінними, а - називають відкликом.

Модель (1) або (2) лінійна відносно невідомих параметрів. Тому її називають лінійною моделлю.

Перед тим як оцінювати вектор , замітимо, що вся теорія будується для моделі (2).

Для оцінки невідомих параметрів використовують метод найменших квадратів (МНК), який полягає в мінімізації суми квадратів залишків. Необхідно мінімізувати величину:

(1.3)

за параметрами . Вираз (1.3) запишеться так:

(1.4)

Шукаємо градієнт :

Розвязуємо рівняння:

Таким чином

(1.5)

Необхідно перевірити, що знайдена стаціонарна точка є точкою мінімуму функції . Справедлива така тотожність

Перевіримо цю рівність:

Ліва частина тотожності мінімальна якщо .

Регресію будемо позначати .

Залишок

Мінімальне значення суми квадратів залишків називають залишковою сумою квадратів (RSS).

Застосуємо формулу (2.1), RSS перепишеться:

Якщо застосувати формулу (2.2), отримаємо:

.

Оцінки та єдині.

Делись добром ;)