logo
Логарифмічно-лінійний аналіз

4. Побудова логарифмічної моделі

Логарифмічно лінійна модель системи з трьох змінних запишеться у вигляді:

лijkABC (4.1)

де ln(nijk) - очікувана частота чарунка (і, j, k) тривимірної таблиці спряженості, обчислена за умови незалежності змінних A, B, C; параметри л визначають внесок у логарифм очікуваної частоти змінних як окремо , так і внаслідок їхньої взаємодії. Параметри л логлінійної моделі задовольняють умовам:

(4.2)

Оцінки параметрів обчислюються за методом максимальної правдоподібності:

(4.3)

Точка в індексі означає середнє значення за цим індексом, так:

(4.4)

де nijk - частота комірки (і, j, k), яка спостерігається N - число комірок таблиці спряженості.

Оцінка дисперсії параметра л для насиченої моделі дорівнює

(4.5)

де дiiZA = 1, якщо А належить групі змінних Z и , в супротивному разі дiiZA = 0. Аналогічно обчислюються дjjZB, дkkZC.

Якщо поділити, знайдену в результаті розрахунків оцінку на оцінку його середнє квадратичного відхилення , то одержимо стандартизоване значення оцінки параметра. Це значення може бути використане для порівняння відносного внеску кожного параметра в nijk, тим самим для обчислення порівняльного значення впливу окремих змінних, кожному парний і множинному взаємозвязки.

Відзначається, що, крім з насиченої моделі стандартизовані параметри , рівні нулю, можна перейти до моделі, більш адекватної вихідних даних або апріорним припущенням про відносини між змінними.

Одержуємо модель ієрархічну за побудовою, оскільки модель врахована множинна взаємодія A, B, C, а це означає припущення існування звязків у будь-якій підгрупі зі складових "старших" взаємозвязок (ABC) змінних, і тому в модель включені такі параметри, як лAB, лBC, лAC, лA, лB, лC. Якщо ж передбачається, що між змінними немає взаємозвязків, то у модель не включається відповідний параметр л . Порядок логлинейной моделі дорівнює найбільшому числу змінних.

Побудова моделі складається з наступних основних етапів: 1) означення порядку логлінійної моделі; 2) відбір параметрів заданого порядку для включення в підсумкову модель.

Логлінійна модель має порядок к, якщо будь-які до к + 1 і більше змінних одночасно незалежні. Тому для означення порядку моделі перевіряються гіпотези про незалежність будь-яких до к + 1 і більш змінних за допомогою критеріїв и (максимальної правдоподібності). Число ступенів вільності для обох статистик дорівнює n-p, де n - число всіх комірок таблиці, а p - число оцінюваних очікуваних частот за умови незалежності змінних.

Крім того, для кожного к-го порядку перевіряється гіпотеза про одночасну незалежність відповідних ним змінних за допомогою цих же критеріїв.

Так, для параметрів третього порядку перевіряється гіпотеза про відсутність потрійної взаємодії.

Спільна перевірка викладених вище гіпотез дозволяє визначити порядок моделі, що щонайкраще відбиває структуру взаємозвязків змінних.

Наступним етапом є відбір параметрів моделі, тобто включення в модель тільки тих параметрів, які відбивають істотні впливи й взаємодії змінних. Для розвязання цієї задачі (перевірки відповідної гіпотези) використовується критерій .

Спочатку обчислюється різниця значень критеріїв , розрахованих відповідно для насиченої моделі к-го порядку й моделі, що відрізняється від насиченої моделі параметром, який перевіряється на значущість. Критерій, побудований у такий спосіб називається критерієм приватного звязку змінних. Критерій для маргінального звязку будуватися подібним чином лише з тією різницею, що його значення обчислюються за таблицею, знайденою підсумовуванням частот вихідної багатомірної таблиці спряженості за критеріями змін, що не входять у досліджуваний на значущість параметр. Число ступенів вільності для критеріїв частинного й маргінального звязку для групи змінних Z обчислюється за формулою :

(4.6)

де I, J, K - число рівнів ознак A, B, C відповідно, дZA = 1, якщо А входить в Z, і а якщо ні, то дZA = 0 і т. п.

Критерії частинного і маргінального звязків еквівалентні за л параметрами, які представляють вплив окремо взятих змінних. Відбір параметрів проводитися за наступним правилом: а) якщо обидва критерії (частинного і маргінального звязку) показують значущість параметра, то він не виключається з початкової повної моделі; б) якщо обидва критерії вказують на його незначущість, то параметр виключається з моделі; в) якщо ж за одним з критеріїв параметр значущий, а за іншим - ні, то необхідно проводити спеціальне дослідження.