logo
Нечіткий метод групового врахування аргументів

1.4 Аналіз існуючих методів отримання математичних моделей

Моделювання та прогнозування з використанням методу найменших квадратів.

В основі логіки методу найменших лежить прагнення дослідника підібрати такі оцінки и0 ,и1 ,…,иp для невідомих значень параметрів функції регресії відповідно и0 ,и1 ,…,иp, при яких згладжені (регресійні) значення и0+и1x1(1)+…+иpx1(p) результуючого показника якомога менше відрізнялись від відповідних спостережених значень yi. Спробуємо математично сформулювати цей принцип. Введемо у якості міри розходження згладженого та спостережуваного (в і-тому спостереженні) значень результуючого показника різницю

(1)

(еi - називаються невязками). Як бачимо, значення и0 ,и1 ,…,иp слід підбирати таким чином, щоб мінімізувати деяку інтегральну характеристику невязок. Нехай такою інтегральною характеристикою буде підганяння (вирівнювання) значень уі, за допомогою лінійної функції від xi(1) ,xi(2),…,xi(p) (i=1,2,…,n) величину

(2)

Безперечно, величина Q буде визначатися конкретним вибором значень оцінок параметрів и0 ,и1 ,…,иp . Оцінки за методам найменших квадратів (МНК - оцінки) и0 МНК ,и1 МНК ,…,иp МНК якраз і підбираються таким чином, щоб мінімізувати величину Q, визначену співвідношенням (1), тобто

(3)

Розглянемо випадок багатьох пояснюючих змінних у матричній формі:

вектор стовпчик невязок;

-(4)

оптимізуючий (по И) критерій методі найменших квадратів.

Перед тим, як виписати необхідні умови екстремуму, перетворимо праву частину (5)

(5)

В цьому перетворенні ми скористалися правилом транспонування добутку матриць, а також тим, що - число, яке співпадає зі своїм транспонованим значенням.

Необхідні умови, яким задовольняє розвязок оптимізаційної задачі (1.5), отримуються шляхом диференціювання правої частини (5) по и0 ,и1 ,…,иp

,

Звідки

(6)

Основні припущення моделей, побудованих на основі МНК.

Для того, щоб МНК-оцінки були оптимальними, необхідно і достатньо, щоб виконувалися наступні вимоги.

1. Відсутність мультиколінеарності між пояснюючими змінними x1,…,xn, тобто фактори повинні бути незалежними між собою. Іншими словами, не повинно бути точного лінійного звязку між двома або більше факторами. При порушенні цієї вимоги матриця з рівняння (6) стає виродженою і її не можна обернути.

2. Незміщеність оцінок. Оцінка и параметра И називається незміщеною, якщо (для векторного параметра мається на увазі одночасне виконання для всіх компонентів вектора и та И)

3. Коваріаційна матриця дорівнює

Для досягнення цих вимог повинні виконуватися основні припущення моделі.

1. Випадкова величина і є нормально розподіленою.

2. Математичне сподівання і-го значення (i=1,n) випадкової величини « дорівнює нулеві

.

3. Випадкові величини незалежні між собою

.

4. Матриця спостережень X нестохастична. тобто вона утворюється з фіксованих елементів.

Оцінювання якості моделей за двома параметрами:

· коефіцієнтом детермінації. В основі оцінювання параметра лежить відношення частини дисперсії, що пояснює регресію та загальною дисперсією

(7)

Цей коефіцієнт показує ступінь тісноти статистичного звязку між побудованими модельними оцінками та спостережуваними даними.

· t - критерій Стюдента. В основі оцінки лежить припущення про нормальний розподіл випадкової величини з нульовим математичним сподіванням та постійною дисперсією у2

.

та, що у випадку 6агатофакторноі регресії кожний параметр також відповідає нормальному законові розподілу

(8)

з математичним сподіванням яке дорівнює значенню параметра узагальненої регресії в та дисперсією, яка дорівнює дисперсії випадкової величини у2, помноженої на відповідний діагональний елемент зворотної матриці. Справжнє значення дисперсії випадком, величини невідоме, тому ми змінюємо його на оцінку дисперсії. Така заміна призволить до того, що кожний елемент вектора (8) відповідатиме вже t-розподілу Стюдента з (n-k) ступенями вільності, що дає змогу обчислити t-статистику для кожного параметра:

зі ступенями вільності df=(n-k)

Т-розподіл Стюдента дає змогу протестувати гіпотезу щодо значення кожного параметра та побудувати їхні інтервали довіри.

· F-відношення показує ступінь адекватності моделі в цілому

Обчислений критерій порівнюється з табличним значенням . При ., модель вважається адекватною.

Основний і головним недоліком застосування даної методології є порушенім хоча б однієї з умов ефективності МНК-оцінок. Як бачимо, наприклад, при мультиколінеарності неможливо отримати оцінки взагалі. Також немає ніякої гарантії про відсутність автокореляції залишків отриманої моделі.

Другий недоліком даної моделі є обовязкова умова переважання кількості спостережень над кількістю досліджуваних параметрів. При порушенні даної вимоги повністю ламається апарат дослідження якості отриманих моделей, оцінки значимості коефіцієнтів моделі.

Третім вирішальним недоліком є те, що модель не заходиться автоматично, а лише досліджуються висунуті гіпотези про взаємозвязки між змінними. При обмеженому часі на моделювання цей недолік є провідним.

Як побачимо нижче, застосування нечіткого методу групового врахування аргументів уникає дані недоліки.

Моделювання процесів з використанням методів лінійного і нелінійного програмування.

Дану групу методів ще називають методами оптимального планування. 3 цієї назви і випливає їхня суть. Вона полягає в тому, що дослідник (аналітик) намагається досягти максимально корисного за складеним ним критерієм ефективності використання ресурсів при заданих обмеженнях на ці ресурси.

Цільовою функцією, як правило, бувають вимога максимізації або мінімізації. Обмеженнями моделей даного класу є символьне (у вигляді функцій) представлення обмеженості ресурсів.

Критерієм оптимальності розвязку задач даного типу є максимум (мінімум) цільової функції на множині припустимих розвязків моделі - множині утвореної обмеженнями моделі.

З математичної точки зору, основна ідея, застосування методів даного класу полягає у знаходженні оптимального поєднання ресурсів множинні припустимих планів. В залежності від форми цільової функції та вигляду обмежень методи поділяються на задачі лінійного та нелінійного програмування.

В задачі лінійного програмування цільова функція та обмеження лінійні. Множина допустимих рішень, в такому випадку - це опуклий многогранник. І задача оптимізації зводиться до перебору всіх крайніх точок даного многогранника.

В противному випадку, якщо цільова функція або обмеження набувають нелінійного характеру, для знаходження оптимального розвязку використовується принцип опуклості (увігнутості) задачі нелінійного програмування, яке гарантує досягнення глобального оптимуму на множині припустимих рішень.

Недоліки цього класу моделей очевидні.

1. Необхідність мати достатньо обмежень для утворення множини припустимих рішень. У випадку незадоволення даної вимога множина рішень стає необмеженою і зникає гарантія отримання оптимального рішення. Дуже часто, отримані розвязки не мають економічного обґрунтування.

2. Необхідність мати чітко сформульовану цільову функцію - критерій якості отриманого розвязку. Дуже часто його важко побудувати. До того ж існує небезпека, що побудована функція якості є субєктивною думкою дослідника, що може не відповідати дійсності. Отже, для отримання максимально якісного розвязку необхідно вкласти максимум інформації про досліджуваний обєкт у вигляді обмежень та скласти максимально обєктивний критерій оцінки ефективності отриманої моделі.

Моделювання процесів і використання методів еволюційного або генетичного пошуку

Еволюційні алгоритми вперше розроблені Джоном Холандом (John Holland) у 1970-х роках, сьогодні частіше називають генетичними алгоритмами, оскільки вони імітують процеси природного відбору.

Генетичні алгоритми набагато рідше, ніж методи, які базуються на обчисленні градієнтів, зупиняється в точці локального оптимуму або осцілюють в околі точок розриву. З іншого боку, вони потребують дуже великої кількості обчислень і не гарантують знаходження глобального оптимуму.

Основні припущення моделей наступні.

Базуючись на біологічних концепціях, генетичний алгоритм помітно відрізняється від інших класів моделей. Наведемо перелік основних властивостей та ідей алгоритму.

1. Алгоритм використовує випадково обрані початкові точки (отже даний метод недетермінований).

2. В той час, коли у більшості методів зберігається лише найкращий розвязок, знайдений у процесі пошуку, в генетичному алгоритмі зберігається велика кількість проміжних результатів, які називають популяціями можливих розвязків, не всі з яких є найкращими розвязками. Дану популяцію використовують для створення нових початкових точок, не обовязково в околі поточного найкращого розвязку, що допомагає алгоритму уникати зупинок в локальному оптимумі.

3. По аналогії з генними мутаціями в біології алгоритм час від часу проводить випадкові зміни в одному або декількох членів популяції для створення нових потенційних початкових точок «нащадків», які можуть знаходитись далеко від решти членів даної популяції.

4. Як при статевому способі розмноження, елементи існуючих в популяції розвязків комбінуються одне з одним за допомогою операції, яка нагадує схрещування ланок ДНК, щоб створити новий потенційний розвязок, яке має ознаки кожного з батьківських розвязків.

5. Будь-які порушення обмежень новими рішеннями призводить до віднімання (в моделі максимізації) зі значення цільової функції для даного розвязку, або додавання до нього ( в моделі мінімізації) «штрафу», сума якого відображає ступінь порушення обмеження. Це змінене значення цільової функції стає мірою «придатності» даного рішення.

6. Аналогічно до природного відбору, початкові точки - «нащадки», які не покращують значення цільової функції і не допомагають отримати нові початкові точки, врешті-решт видаляються з популяції як «непридатні».

В генетичному алгоритмі розвязок задачі надано у вигляді геному (або хромосома). Алгоритм працює з популяцією, яка містить десятки. або навіть сотні припустимих розвязків. З цієї популяції розвязків генетичний алгоритм створює за допомогою мутації та схрещування нові розвязки, щоб отримати набір претендентів на «звання» найкращого розвязку. Спрощено кажучи, в ході схрещування комбінуються дві (батьківські) хромосоми, щоб отримати одну нову хромосому (нащадок). Як і при статевому розмноженні, ідея схрещування полягає втому, що нова хромосома може виявитися краще обох батьківських, якщо взяти кращі характеристики обох кожної з них.

На відміну від схрещування, операція мутації привносить деякий елемент випадковості у нові хромосоми нащадки. Її задача полягає в тому, щоб допомогти програмі знайти такі розвязки-нащадки, які неможливо отримати шляхом схрещування. Розвязки-нащадки з низьким значенням виграшу («поганим» значенням цільової функції), зберігаються, оскільки вони можуть породити в наступних поколіннях нащадків з високим виграшем («кращим» значенням цільової функції). Якщо цього не відбувається, ці нащадки врешті-решт видаляються з популяції розвязків.

Генетичні алгоритми - це алгоритми пошуку. які використовують структурований обмін інформацією (схрещування) і рандомізацію (мутації) для формування процедуру пошуку, які мають властивості природних процесів: в кожному поколінні створюється новий набір розвязків, створений з найбільш придатних екземплярів попереднього покоління. Зазначимо, що генетичний алгоритм не є випадковим переміщенням по простору можливих розвязків Це було б занадто неефективно. Навпаки, даний алгоритм ефективно використовує накопичену інформацію для формування нових розвязків, які як очікуються, покращать виграш. Тому алгоритм іноді називають методом спрямованого випадкового пошуку.

До даного методу відносяться різновиди методів групового врахування аргументів. Як було вже зазначено вище, до основних недоліків даного алгоритму належать.

1. Великий обєм памяті Це повязано з великою кількістю членів популяції на рівні, великою кількістю «епох» - рівнів, а також з потребою зберігати додаткову інформацію про параметри («паспорт») кожного нащадку.

2. Відносно повільна збіжність алгоритму. Хоча даний алгоритм і є спрямованим, часте «вибивання» з наближених до оптимуму точок внаслідок мутацій значно більше займає час пошуку оптимального рішення

3. Алгоритм потребує усталених правил функціонування.