Статистичний аналіз тенденцій захворюваності в Україні

дипломная работа

1.2 F-критерій

Розглянемо лінійну модель Y =Хв + е, в якій матриця X має розмір nр і ранг р, е ~ Nn(0, у2In). Нехай ми хочемо перевірити гіпотезу H: Ав = c, де А - відома (qp) - матриця рангу q, а с - відомий (q1) - вектор. Позначимо

RSS = (Y -X)(Y-X) = (n - p)S2

RSSH = (Y -XH)(Y-XH)

Де H = + (ХХ)-1А[А(ХХ)-1А]-1(с-А), (1.2.1)

і RSSH - мінімальне значення ее при обмеженнях Ав = с.

Теорема 1.2.1.

(I) RSSH - RSS = (А- c) [А (ХХ)-1 А]-1 (А- c),

(II) М [RSSH - RSS] = у2q + (Ав -с) [А(ХХ)-1А]-1(Ав - с).

(III) Якщо гіпотеза Н: Ав = с справедлива, то статистика

F =

має розподіл Фішера Fq,n-p (F-розподіл з q і n - p ступенями вільності відповідно).

(IV) Якщо с = 0, то статистика F приймає вигляд

F = ,

де РH - симетрична і ідемпотентна матриця і РНP = PРН = РН

Доведення.

(I) Спочатку доведемо тотожність:

||Y - XH||2 = ||Y - X||2 + ||X( - H)||2

Розглянемо

||X( - )||2 = (X( - в))X( - в) = ( - в)XX ( - в) = ( - H + H - в)XX ( - H + H - в) =

= ( - H)XX ( - H) + (H - в)XX (H - в) =

= 2((XX)-1A)XX(H - в) = A(XX)-1 XX(H - в) = A(H - в) = (AH - Aв) = (c - c) = 0= (X(-H))X( - H) + (X(H - в))X(H - в) = ||X( - H)||2 + ||X(H- в)||2.

Далі,

ее = (Y - Xв)(Y - Xв) = ||Y - Xв||2 = (Y - X)(Y - X) +

+ ( - в)XX( - в) = ||Y - X||2 + ||X( - в)||2

Підставляємо

||X( - в)||2:

ее = ||Y - X||2 + ||X( - H)||2 + ||X( - в)||2

ее досягає мінімального значення при ||X( - в)||2 = 0, тобто

X( - в) = 0

в = , Х ? 0 (оскільки стовпці Х лінійно незалежні)

Покладаючи в ее в = , знаходимо

||Y - XH||2 = ||Y - X||2 + ||X( - H)||2

Тоді

RSSH - RSS = (Y - XH)(Y - XH) - (Y - X)(Y - X) =

= ||Y - XH||2 - ||Y - X||2 = ||X( - H)||2 = (X( - H))(X( - H)) =

= ( - H)XX( - H) =

= =

= ((XX)-1A(A(XX)-1A)-1(A - c))XX((XX)-1A(A(XX)-1A)-1(A - c)) =

= (A - c)(A(XX)-1A)-1A(XX)-1(XX)(XX)-1A(A(XX)-1A)-1(A - c) =

= (A - c)(A(XX)-1A)-1(A - c).

(II) Скористаємось лемою.

Нехай Y = Y(nЧ1) - випадковий вектор, A(nЧn) = A - симетрична матриця. Якщо MY = и, DY = ?, тоді

M(YAY) = tr(A?) + иAи.

Раніше, доведено, що

~ Np(в, у2(ХХ)-1), A ~ Nq(Aв, у2A(ХХ)-1A).

Позначимо Z = А - c і В = А(ХХ)-1А. Тоді

M[Z] = M(А - c) = A - c = = Ав - c і

D[Z] = D(А - c) = D[A] = у2B

Тоді

M[RSSH - RSS] = M[ZВ-1Z] = tr[у2В-1В] + (Ав - с) В-1(Ав - с) =

= tr[у2Iq] + (Aв - c)B-1(Aв - c) =

= у2q + (Aв - c)B-1(Aв - c). (1.2.2)

(III) Відомо, що ~ Nq(в,у2А(ХХ)-1), тоді

A ~ Nq(Aв, у2A(ХХ)-1A) і

А - с ~ Nq(Aв - c, у2A(ХХ)-1A),

, тоді .

Розглянемо (RSSH - RSS)/у2

= (А - с) (D[А])-1(А - с),

Раніше доведено, що RSS/у2 ~ (теорема 1.1.6 (IV)), тоді статистика

при справедливій гіпотезі Н має вигляд [/q]/[/(n - р)]. Отже, якщо гіпотеза Н справедлива, то F ~ Fq,n-p.

(IV) Нехай у виразі (1.2.1) c = 0, тоді маємо

= X(H - (ХХ)-1А[А(ХХ)-1А]-1А) = X -

- X(ХХ)-1А[А(ХХ)-1А]-1А =

= X(ХХ)-1 ХY - X(ХХ)-1А[А(ХХ)-1А]-1А(ХХ)-1 ХY =

={X(ХХ)-1X - X(ХХ)-1А[А(ХХ)-1А]-1А(ХХ)-1Х}Y= (Р-Р1)Y, (1.2.3)

Тобто

(1.2.4)

де РH - симетрична матриця. Спростивши вираз для матриці Р1, знаходимо, що Р1 симетрична і ідемпотентна і Р1Р = РР1 = Р1. Звідси одержуємо

= Р2 - Р1P - РP1 + = P - 2P1 + P1 = P - P1 = PH (1.2.5)

PHP = (P - P1)P = P - P1 = PH (1.2.6)

і РРH = РH (останнє одержуємо транспонуванням).

Y - X = Y - X(ХХ)-1 ХY = Y(I - X(ХХ)-1 Х) = (I - P)Y.

Тоді

RSS = (Y - X)(Y - X) = ((I - P)Y)(I - P)Y =

= Y(I - P)(I - P)Y = Y(In - Р)Y

Aналогічно

RSSH = (Y - XH)(Y - XH) = Y(In - РH)Y. (1.2.7)

Таким чином,

RSSH - RSS = Y(In - РH)Y - Y(In - Р)Y = Y(I - РH - I + P)Y = Y(P - РH)Y.

Отже,

Теорема доведена.

F - критерій для перевірки гіпотези H: Aв = c.

Гіпотезу H: Aв = c відхиляють при

і не відхиляють в супротивному разі. Рівень значущості критерію б.

Делись добром ;)