Види розподілу ймовірностей й оцінка його параметрів

3.2 Поняття інтервальної оцінки. Інтервальні оцінки параметрів нормального розподілу

Обчислена на основі вибірки оцінка є лише наближенням до невідомого значення параметра навіть у тому випадку, коли ця оцінка заможна, незміщена й ефективна. Виникає питання: не можна чи зазначити таке А, для якого з заздалегідь заданої близької до одиниці імовірністю 1 - б гарантувалося б виконання нерівності: |-| < ?, або інакше, для котрого

(3.2.1)

Якщо таке А існує, то інтервал (-?, +?) називають іньервальної оцінкою параметра 9, або довірчим інтервалом; -?, + ? -- нижньої і верхньої довірчими границями; ? -- помилкою оцінки , 1-б -- надійністю інтервальної оцінки, або довірчою імовірністю. Вибір довірчої імовірності визначається конкретними умовами; звичайно використовуються значення 1 - б, рівні 0,90; 0,95; 0,99.

Оцінка , будучи функцією випадкової вибірки, є випадковим розміром, ? також випадкова: її значення залежить від імовірності 1 - б і, як правило, від вибірки. Тому довірчий інтервал випадковий і вираження (3.2.1) варто читати так: «Інтервал (-?, +? накриє параметр з імовірністю 1 -- б», а не так: «Параметр потрапить у інтервал (-?, +? з імовірністю 1 - б».

У формулі (3.2.1) границі довірчого інтервалу симетричні щодо крапкової оцінки. Однак не завжди вдасться побудувати інтервал, що володіє такою властивістю. Для одержання довірчого інтервала найменшої довжини при заданому обємі виборки п і заданої довірчої імовірності 1 - а в якості оцінки параметра варто брати ефективну або асимптотично ефективну оцінку.

Існує два підходи до побудови довірчих інтервалів.

Перший підхід, якщо його вдасться реалізувати, дозволяє будувати довірчі інтервали при кожному кінцевому обємі вибірки п. Он заснований на доборі такої функції ш (,), називаної надалі статистикою, щоб:

її закон розподілу був відомий і не залежав від ;

функція ш(,) була безупинної і строго монотонної по .

Задавшись довірчою імовірністю 1- б, знаходять двосторонні критичні границі , що відповідають імовірності а. Тоді з імовірністю 1 -- б виконується нерівність І

(3.2.2)

Вирішивши цю нерівність щодо 0, знаходять границі довірчого інтервалу для . Якщо щільність розподілу статистики в ш(,) симетрична щодо осі 0у, то довірчий інтервал симетричний щодо .

Другий підхід, що одержав назву асимптотичного підходу, більш універсальний; однак він використовує асимптотичні властивості крапкових оцінок і тому придатний лише при досить великих обємах вибірки.

Розглянемо перший підхід на прикладах довірчого оцінювання параметрів нормального розподілу.

Інтервальна оцінка математичного чекання при відомій дисперсії. Отже, Х~ N (а, у), причому значення параметра а не відомо, а значення дисперсії а² відомо.

При Х~ N (а, у) ефективною оцінкою параметра а є X, при цьому X ~ N(a,у а/vп). Статистика має розподіл N(0;1) незалежно від значення параметра а і як функція параметра а безупинна і строго монотонна. Отже, з обліком нерівності (3.2.2) і симетричності двосторонніх критичних границь розподілу y(0; 1) будемо мати:

Вирішуючи нерівність щодо а, одержимо, що з імовірністю 1 - б виконується нерівність

(3.2.3)

при цьому

(3.2.4)

що відповідає результату (6.1.23); число и_а знаходять з умови Ф(u_а) = (1-б)/2.

Зауваження. Якщо п велике, оцінку (3.2.3) можна використовувати і при відсутності нормального розподілу розміру X, тому що в силу наслідку з центральної граничної теореми при випадковій вибірці великого обєму п

Зокрема, якщо Х = ц, де ц - випадкове число успіхів у великому числі п випробувань Бернуллі, то

і з імовірністю ? 1 - б для імовірності р успіху в одиничному випробуванні виконується нерівність

(3.2.5)

Замінюючи значення p і q=1-pn лівій і правій частинах нерівності (3.2.4) їхніми оцінками і , що припустимо при великому п, одержимо наближений довірчий інтервал для імовірності р:

(3.2.6)

Приклад 3.2.1 Фірма комунального господарства бажає на основі вибірки оцінити середню квартплату за квартири визначеного типу з надійністю не менше 99% і погрішністю, меншої 10 д.е. Припускаючи, що квартплата має нормальний розподіл із середнім квадратичнім відхиленням, що не перевищує 35 д.е., знайдіть мінімальний обєм вибірки.

Вирішення. За умовою потрібно знайти таке п, при якому , де а і Х- генеральна і вибіркова середні.

Прирівнявши 1 - б = 0,99, по табл. П. 4.1 знайдемо число и_а, при якому Ф() = (1 - б)/2 = 0,495; и_0.01= 2,6. При ? =10 і б = 35 із формули (3.2.4) одержимо п == 82,81. Але тому що з ростом 1 - б і зменшенням ? зростає п, то п > 82,81 і п_т_in = 83 (звичайно, при зменшенні верхньої границі для про буде зменшуватися і п_тin). Т

Інтервальна оцінка математичного чекання при невідомій дисперсії. Отже, Х~ N (а, о), причому числові значення ні а, ні б² не відомі. По випадковій вибірці знайдемо ефективну оцінку параметра а: і оцінку параметра у².

Побудова інтервальної оцінки для а засновано на статистику , що при випадковій вибірці з генеральної сукупності Х~ N (а; у) має розподіл Стьюдента з (п - 1) ступенем волі незалежно від значення параметра а і як функція параметра а безупинна і строго монотонна.

З обліком нерівності (3.2.2) і симетричності двосторонніх критичних границь розподілу Стьюдента будемо мати:

Вирішуючи нерівність -ta відносно а, одержимо, що з імовірністю 1 - б виконується нерівність

(3.2.7)

і помилка оцінки X при невідомому значенні параметра о²

(3.2.8)

де число знаходять по табл. П. 4.2 при k=n-1 пр = б.

Зауваження. При k=п-1>30 випадковий розмір t(k) має розподіл, близьке до N (0; 1), тому з імовірністю ? 1 - б

(3.2.9)

Приклад 3.2.2 Для галузі, що включає 1200 фірм, складені випадкова вибірка з 19 фірм. По вибірці опинилося, що у фірмі в середньому працюють 77,5 чоловік при середньому квадратичному відхиленні s = 25 чоловік. Користуючись 95%-нім довірчим інтервалом, оціните середнє число працюючих у фірмі по всій галузі і загальне число працюючих у галузі. Передбачається, що кількість працівників фірми має нормальний розподіл.

Вирішення. При k = n -1 = 18 і р = б = 1 - 0,95 = 0,05 знайдемо в табл. П. 4.2 t₀₀₅ = 2,10. Довірчий інтервал (3.2.7) прийме вид: (65,5; 89,5). З імовірністю 95% можна стверджувати, що цей інтервал накриє середнє число працюючих у фірмі по всій галузі. Тоді довірчий інтервал для числа працюючих у галузі в цілому такий: (1200-65,5; 1200-89,5). Т

Інтервальна оцінка дисперсії (середнього квадратичного відхилення) при відомому математичному чеканні. Ефективною оцінкою дисперсії в цьому випадку є .

Використовуються два варіанти інтервальної оцінки для у²(у).

1. Основу першого варіанта складає статистика

(3.2.10)

який має розподіл%² із п ступенями волі незалежно від значення параметра а² і як функція параметра а² > О безупинна і строго монотонна.

Отже, з обліком нерівності (3.2.2) будемо мати:

де і -- двосторонні критичні границі Х²-распределения з п ступенями волі.

Вирішуючи нерівність щодо б², одержимо, що з імовірністю 1 -- б виконується нерівність

(3.2.11)

і з такою же імовірністю виконується нерівність

(3.2.12)

Числа і знаходять по табл. П. 4.3 при k = п і відповідно при р=б/2 і р=1-б/2. Інтервальна оцінка (3.2.12) несиметрична щодо .

2. Другий варіант припускає знаходження інтервальної оцінки для а при заданій надійності 1 - б у виді

(3.2.13)

При 5_а < 1 границі цієї оцінки симетричні щодо і помилка оцінки , що гарантується з імовірністю 1 - б,

(3.2.14)

Як знайти 8_а? Вирішуючи нерівність (3.2.13) щодо n/уІ, одержимо, що з імовірністю 1 -- б виконується нерівність

(3.2.15)

або, з огляду на формулу (3.2.10) і замінивши п на k, а б на р,

(3.2.16)

Значення , задовольняють рівнянню (3.2.16) при різних р та k,приведені до таблиці П. 4.6.

Тоді,

(3.2.17)

де -- число, знайдене в табл. П. 4.6 при k = п и р = а.

Інтервальна оцінка дисперсії (середнього квадратичного відхилення) при невідомому математичному чеканні. Найкращою крапковою оцінкою дисперсії в цьому випадку є , і побудова інтервальної оцінки для а² засновано на статистику , який при випадковій вибірці з генеральної сукупності Х~ N(a; б) має розподіл Х² із (п -- 1) ступенем волі.

Проробивши викладення для розміру Х²(п -- 1), подібні викладенням при відомому математичному чеканні, одержимо два варіанти інтервальної оцінки для а² (у):

(3.2.18)

(3.2.19)

де числа і знаходять по табл. П. 4.3 при k = п - 1 і відповідно при р = б/2 і р=- 1 - б/2.

(3.2.20) (3.2.21)

при цьому помилка оцінки s, що гарантується з імовірністю 1 - б,

(3.2.22)

число 5_га знаходять по табл. П. 4.6 при k = п -- 1 і р = б.

Зауваження. При k = п -- 1 > 30 випадковий розмір Х²(к) має розподіл, близьке до , тому з імовірністю ? 1 - б

(3.2.23)

Приклад 3.2.3 Варіація щодобового прибутку випадково обраних 10 кіосків деякої фірми, обмірюване розміром де - прибуток і-го кіоска, опинилася рівної 100 д. е. Знайдіть таке ?, при якому з надійністю 90% можна гарантувати, що варіація прибутку по всіх кіосках фірми не вийде за межі 100 + ?. Передбачається, що прибуток - нормально розподілений розмір.

Тому що середній прибуток кіоску по усій фірмі не відомий і інтервал для про повинний бути симетричним щодо s, для розрахунку помилки оцінки s при 1 - а = 0,9 скористаємося формулою (3.2.22).

При k = 9 та р= б = 0,1 по табл. П. 4.6 знайдемо = 0,476; тоді ? = 47,6. З надійністю 90% можна стверджувати, що генеральна варіація прибутку кіоску не вийде за межі 100 + 47,6.

Приклад 3.2.4 Користуючись 90%-нім довірчим інтервалом, оціните в умовах завдання 7.2 варіацію працюючих у фірмі по всій галузі.

Вирішення. За умовою п = 19, s = 25, 1 - б = 0,9. Знайдемо два варіанти довірчого інтервалу:

Відповідно формулі (3.2.19)

а тому що при k = п-1 = 18 верхня довірча границя , а нижня (див. табл. П. 4.3), то 19,740 < б < 34,613 - ця оцінка не симетрична щодо s.

2. Відповідно до рівняння (3.2.21),

а так як при k = п -1 = 18 50, = 0,297 (див. табл. П. 4.6), то 17,575<у<32,425 - ця оцінка симетрична щодо s. Вона, як і випливало очікувати, відрізняється від попередньої інтервальної оцінки, однак

3.2.1 Асимптотичний підхід до інтервального оцінювання

З прикладами інтервальних оцінок, що мають місце тільки при великих обємах вибірок, ми вже зштовхувалися. Так, якщо розподіл випадкового розміру X відмінно від нормального, але п велике, то з імовірністю ? 1 - а інтервальна оцінка для MX = а має вид нерівності (3.2.3); з імовірністю ? 1-а інтервальна оцінка для р при великих п має вид нерівності (3.2.6) і т. д. [див. нерівності (3.2.9), (3.2.23)].

Розглянемо асимптотичний підхід у загальному випадку.

Раніше було встановлено, що при виконанні досить широких умов оцінка параметра , отримана або методом моментів або методом максимальної правдоподібності, має в самому загальному випадку асимптотичний нормальний розподіл і асимптотично несумісної, тобто при великих п оцінка . Однак на відміну від ситуації, розглянутої на раніше, де дисперсія D оцінки передбачалася відомої, у загальному випадку дисперсія Dоцінки залежить від оцінюваного невідомого параметра и:

(3.2.24)

Тому напряму перший підхід до довірчого інтервалу неприйнятий.

Порушимо питання так: не можна чи перетворити оцінку у g - g() це невідомий параметр у g = g (и) так, щоб дисперсія D не залежала від и. Викладемо схему добору такого перетворення, а потім пояснимо, як, використовуючи його, знайти інтервальну оцінку для и.

Нехай и -- оцінка методу моментів: и, а отже, і g = g(и) є функціями вибіркових моментів. Тоді, відповідно до теореми про властивості функцій вибіркових моментів (див. 3.1), розподіл оцінки при великих п близько до нормального, і, з обліком виражень (3.5) і (3.2.25),

(аналогічні вираження утворюються і для оцінок максимальної правдоподібності в регулярному випадку). Але тому що дисперсія Dне повинна залежати від и, то вираження c(и) g(и) повинно бути постійним, наприклад, c(и)g(и) = 1. Тоді g(и)= 1/ c(и) і

(3.2.25)

при цьому довільна постійна в невизначеному інтегралі вибирається з розумінь простоти остаточних виражень.

Отже, при великих п розподіл оцінки близько до нормального, при цьому , a і, отже,

Тому при великих п для g(9) з імовірністю * I -- а має місце нерівність, подібна нерівності (3.2.3):

(3.2.26)

Застосувавши до всіх частинам нерівності (3.2.26) перетворений не , що є зворотною функцією до функції g, одержимо інтервальну оцінку для и.

Приклад 3.2.5 Побудуємо довірчий інтервал для параметра розподілення Пуассона: Р(Х = х) =л.

У прикладі 3.2.2 була знайдена оцінка методу моментів параметра ; будучи оцінкою методу моментів, має асимптотично нормальний розподіл (ця властивість оцінки випливає також і з центральної граничної теореми), при цьому - оцінка, тому що , а дисперсія оцінки , залежить від параметра л:

Зіставивши вираження для с вираженням (3.2.24), одержимо

і, відповідно до рівності (3.2.25),

З урахуванням виду функції нерівність (3.2.26)

(3.2.27)

Для функції при х ? 0 і у ? 0 зворотна функція . Тому, якщо в нерівності (3.2.27)

то, застосувавши до всіх його частинам перетворення одержимо нерівність

(3.2.28)

яке виконується при великих п з імовірністю ? 1 - б.

Приклад 3.2.6 Побудуємо довірчий інтервал для р - імовірності успіху в одиничному випробуванні.

У прикладі 3.2.4 методом максимальної правдоподібності для р була знайдена оцінка , де - випадкове число успіхів у п випробуваннях Бернуллі; р має асимптотичний нормальний розподіл, при цьому М = р, a D= р(1 - р)/п - дисперсія залежить від параметра р.

Зіставивши вираження для D із вираженням (3.2.24), одержимо

і, відповідно до формули (3.2.25),

З обліком виду функції g(p) нерівність (3.2.26) прийме вид:

(3.2.29)

Для функції при 0 < < 1 зворотна функція , де 0 < у < р. Тому, якщо в нерівності (3.2.29)

та , то застосувавши до всіх його частинам перетворення одержимо нерівність;

який виконується при великих п з імовірністю ? 1 - б.

Содержание