Методи оцінювання параметрів та перевірка статистичних гіпотез

контрольная работа

2.1. Означення емпіричної функції розподілу. Емпіричні значення параметрів

Означення. Нехай 1, 2, ..., n - вибірка з неперервного розподілу F. Функцію (x), визначену на R1 рівністю

(x) = ,

будемо називати емпіричною функцією розподілу.

При кожному фіксованому x емпірична функція розподілу , як функція випадкового вектора 1, 2, ..., n, є випадковою величиною, тому також є функціею й , тобто (x) = (x; ), , x R1.

Для кожного фіксованого x емпірична функція розподілу (x) є незміщеною та спроможною оцінкою F (x).

Надалі нам буде зручно розглядати вибіркові значення 1, 2, ..., n, розташовані в порядку зростання: 1*, 2*, ..., n* Тобто, 1* - найменше серед значень 1, 2, ..., n ; 2* - друге за величиною і т.д., n *- найбільше з можливих значень.

Означення. Послідовність 1*, 2*, ..., n* будемо називати варіаційним рядом послідовності 1, 2, ..., n; а 1*, 2*, ..., n* - порядковими статистиками.

У термінах порядкових статистик емпіричну функцію розподілу можна подати у вигляді

(x) = (2.1.1)

Безпосередньо з рівності (2.1.1) одержимо, що при фіксованому значення (x) = 0 у кожній точці x проміжку ( - , 1*], оскільки число тих k, при яких k* x, дорівнює нулеві; (x) = 1 / n у кожній точці проміжку (1*, 2*] тому що число тих k, при яких k* x, дорівнює 1 і т.д., і, нарешті, (x) = 1 для кожного x з проміжку (n, + ).

Із вищесказаного випливає, що для кожного фіксованого функція (x) = (x; ) невід`ємна; стала на кожному з проміжків ( - , 1*], (k*, k+1*], k = 1, 2, …, n - 1, (n, + ) (а отже неперервна зліва); неспадна - зростає в точках k* , k = 1, 2, ..., n, стрибками величиною 1 / n.

Зауваження 1. Для вибірок 1, 2, ..., n з неперервних розподілів імовірність збігу вибіркових значень дорівнює нулеві, але оскільки ми фіксуємо результати з зазначеною точністю (наприклад, до третього знака), то внаслідок цього деякі вибіркові значення можуть збігатися. При цьому величина стрибка емпіричної функції розподілу в точці k дорівнює , де m - кількість вибіркових значень, які збігаються з k, враховуючи й k.

Зауваження 2. Розподіл, що відповідає емпіричній функції розподілу (x), будемо називати емпіричним. При кожному фіксованому це дискретний розподіл, що ставить у відповідність кожній точці k , k = 1, 2, ..., n, масу (або , якщо з k збігаються m вибіркових значень, враховуючи й k ).

За допомогою емпіричної функції розподілу можна одержувати інтуїтивно-наочні оцінки параметрів розподілу.

Нехай 1, 2, ..., n - вибірка з розподілу F( ; ), що залежить від параметра , причому параметр невідомий і його необхідно визначити за вибіркою. Припустимо, що параметр однозначно визначається розподілом (функцією розподілу F(x; ) ), тобто

= ( F(x; ) ),

де - функціонал, заданий на множині функцій розподілу. Наприклад, a = M , 2 = D (коли вони існують) є функціоналами функції розподілу F (x) випадкової величини:

a = x F (dx); 2 = (x - t F (dt))2 F (dx).

Вибірка 1, 2, ..., n визначає емпіричну функції розподілу (x). І оскільки (dx) “близька” до F(x; ) ( при кожному х є незміщеною і спроможною оцінкою F(x; ), а = (F(x; ) ), то для оцінювання параметра природно розглядати величину

= ( (x)).

У такий спосіб, наприклад, для a одержимо оцінку

= x (dx) = ,

для 2

= (x - t (dt))2 (dx) = (i )2 =

Інтеграли обчислюються як інтеграли Лебега за дискретним розподілом, зосередженим у точках 1, 2, ..., n з масою 1 / n в кожній з них.

Означення. Оцінку параметра = ( F(x; )), одержану за формулою = ( (x)), будемо називати емпіричним (вибірковим) значенням параметра .

Зокрема,

=

- емпіричне (вибіркове) середнє,

= 2

– емпірична (вибіркова) дисперсія.

Теорема 2.1 Нехай 1, 2, ..., n - вибірка з розподілу F і g(x) - борелівська функція на R1 зі значенням в R1. Якщо

G = g(x) F (dx) ,

то вибіркове значення величини G

= g(x) (dx) =

є спроможною й незміщеною оцінкою параметра G.

Делись добром ;)