Статистичний аналіз тенденцій захворюваності в Україні
1.2 F-критерій
Розглянемо лінійну модель Y =Хв + е, в якій матриця X має розмір nр і ранг р, е ~ Nn(0, у2In). Нехай ми хочемо перевірити гіпотезу H: Ав = c, де А - відома (qp) - матриця рангу q, а с - відомий (q1) - вектор. Позначимо
RSS = (Y -X)(Y-X) = (n - p)S2
RSSH = (Y -XH)(Y-XH)
Де H = + (ХХ)-1А[А(ХХ)-1А]-1(с-А), (1.2.1)
і RSSH - мінімальне значення ее при обмеженнях Ав = с.
Теорема 1.2.1.
(I) RSSH - RSS = (А- c) [А (ХХ)-1 А]-1 (А- c),
(II) М [RSSH - RSS] = у2q + (Ав -с) [А(ХХ)-1А]-1(Ав - с).
(III) Якщо гіпотеза Н: Ав = с справедлива, то статистика
F =
має розподіл Фішера Fq,n-p (F-розподіл з q і n - p ступенями вільності відповідно).
(IV) Якщо с = 0, то статистика F приймає вигляд
F = ,
де РH - симетрична і ідемпотентна матриця і РНP = PРН = РН
Доведення.
(I) Спочатку доведемо тотожність:
||Y - XH||2 = ||Y - X||2 + ||X( - H)||2
Розглянемо
||X( - )||2 = (X( - в))X( - в) = ( - в)XX ( - в) = ( - H + H - в)XX ( - H + H - в) =
= ( - H)XX ( - H) + (H - в)XX (H - в) =
= 2((XX)-1A)XX(H - в) = A(XX)-1 XX(H - в) = A(H - в) = (AH - Aв) = (c - c) = 0= (X(-H))X( - H) + (X(H - в))X(H - в) = ||X( - H)||2 + ||X(H- в)||2.
Далі,
ее = (Y - Xв)(Y - Xв) = ||Y - Xв||2 = (Y - X)(Y - X) +
+ ( - в)XX( - в) = ||Y - X||2 + ||X( - в)||2
Підставляємо
||X( - в)||2:
ее = ||Y - X||2 + ||X( - H)||2 + ||X( - в)||2
ее досягає мінімального значення при ||X( - в)||2 = 0, тобто
X( - в) = 0
в = , Х ? 0 (оскільки стовпці Х лінійно незалежні)
Покладаючи в ее в = , знаходимо
||Y - XH||2 = ||Y - X||2 + ||X( - H)||2
Тоді
RSSH - RSS = (Y - XH)(Y - XH) - (Y - X)(Y - X) =
= ||Y - XH||2 - ||Y - X||2 = ||X( - H)||2 = (X( - H))(X( - H)) =
= ( - H)XX( - H) =
= =
= ((XX)-1A(A(XX)-1A)-1(A - c))XX((XX)-1A(A(XX)-1A)-1(A - c)) =
= (A - c)(A(XX)-1A)-1A(XX)-1(XX)(XX)-1A(A(XX)-1A)-1(A - c) =
= (A - c)(A(XX)-1A)-1(A - c).
(II) Скористаємось лемою.
Нехай Y = Y(nЧ1) - випадковий вектор, A(nЧn) = A - симетрична матриця. Якщо MY = и, DY = ?, тоді
M(YAY) = tr(A?) + иAи.
Раніше, доведено, що
~ Np(в, у2(ХХ)-1), A ~ Nq(Aв, у2A(ХХ)-1A).
Позначимо Z = А - c і В = А(ХХ)-1А. Тоді
M[Z] = M(А - c) = A - c = = Ав - c і
D[Z] = D(А - c) = D[A] = у2B
Тоді
M[RSSH - RSS] = M[ZВ-1Z] = tr[у2В-1В] + (Ав - с) В-1(Ав - с) =
= tr[у2Iq] + (Aв - c)B-1(Aв - c) =
= у2q + (Aв - c)B-1(Aв - c). (1.2.2)
(III) Відомо, що ~ Nq(в,у2А(ХХ)-1), тоді
A ~ Nq(Aв, у2A(ХХ)-1A) і
А - с ~ Nq(Aв - c, у2A(ХХ)-1A),
, тоді .
Розглянемо (RSSH - RSS)/у2
= (А - с) (D[А])-1(А - с),
Раніше доведено, що RSS/у2 ~ (теорема 1.1.6 (IV)), тоді статистика
при справедливій гіпотезі Н має вигляд [/q]/[/(n - р)]. Отже, якщо гіпотеза Н справедлива, то F ~ Fq,n-p.
(IV) Нехай у виразі (1.2.1) c = 0, тоді маємо
= X(H - (ХХ)-1А[А(ХХ)-1А]-1А) = X -
- X(ХХ)-1А[А(ХХ)-1А]-1А =
= X(ХХ)-1 ХY - X(ХХ)-1А[А(ХХ)-1А]-1А(ХХ)-1 ХY =
={X(ХХ)-1X - X(ХХ)-1А[А(ХХ)-1А]-1А(ХХ)-1Х}Y= (Р-Р1)Y, (1.2.3)
Тобто
(1.2.4)
де РH - симетрична матриця. Спростивши вираз для матриці Р1, знаходимо, що Р1 симетрична і ідемпотентна і Р1Р = РР1 = Р1. Звідси одержуємо
= Р2 - Р1P - РP1 + = P - 2P1 + P1 = P - P1 = PH (1.2.5)
PHP = (P - P1)P = P - P1 = PH (1.2.6)
і РРH = РH (останнє одержуємо транспонуванням).
Y - X = Y - X(ХХ)-1 ХY = Y(I - X(ХХ)-1 Х) = (I - P)Y.
Тоді
RSS = (Y - X)(Y - X) = ((I - P)Y)(I - P)Y =
= Y(I - P)(I - P)Y = Y(In - Р)Y
Aналогічно
RSSH = (Y - XH)(Y - XH) = Y(In - РH)Y. (1.2.7)
Таким чином,
RSSH - RSS = Y(In - РH)Y - Y(In - Р)Y = Y(I - РH - I + P)Y = Y(P - РH)Y.
Отже,
Теорема доведена.
F - критерій для перевірки гіпотези H: Aв = c.
Гіпотезу H: Aв = c відхиляють при
і не відхиляють в супротивному разі. Рівень значущості критерію б.