Методи оцінювання параметрів та перевірка статистичних гіпотез
2.1. Означення емпіричної функції розподілу. Емпіричні значення параметрів
Означення. Нехай 1, 2, ..., n - вибірка з неперервного розподілу F. Функцію (x), визначену на R1 рівністю
(x) = ,
будемо називати емпіричною функцією розподілу.
При кожному фіксованому x емпірична функція розподілу , як функція випадкового вектора 1, 2, ..., n, є випадковою величиною, тому також є функціею й , тобто (x) = (x; ), , x R1.
Для кожного фіксованого x емпірична функція розподілу (x) є незміщеною та спроможною оцінкою F (x).
Надалі нам буде зручно розглядати вибіркові значення 1, 2, ..., n, розташовані в порядку зростання: 1*, 2*, ..., n* Тобто, 1* - найменше серед значень 1, 2, ..., n ; 2* - друге за величиною і т.д., n *- найбільше з можливих значень.
Означення. Послідовність 1*, 2*, ..., n* будемо називати варіаційним рядом послідовності 1, 2, ..., n; а 1*, 2*, ..., n* - порядковими статистиками.
У термінах порядкових статистик емпіричну функцію розподілу можна подати у вигляді
(x) = (2.1.1)
Безпосередньо з рівності (2.1.1) одержимо, що при фіксованому значення (x) = 0 у кожній точці x проміжку ( - , 1*], оскільки число тих k, при яких k* x, дорівнює нулеві; (x) = 1 / n у кожній точці проміжку (1*, 2*] тому що число тих k, при яких k* x, дорівнює 1 і т.д., і, нарешті, (x) = 1 для кожного x з проміжку (n, + ).
Із вищесказаного випливає, що для кожного фіксованого функція (x) = (x; ) невід`ємна; стала на кожному з проміжків ( - , 1*], (k*, k+1*], k = 1, 2, …, n - 1, (n, + ) (а отже неперервна зліва); неспадна - зростає в точках k* , k = 1, 2, ..., n, стрибками величиною 1 / n.
Зауваження 1. Для вибірок 1, 2, ..., n з неперервних розподілів імовірність збігу вибіркових значень дорівнює нулеві, але оскільки ми фіксуємо результати з зазначеною точністю (наприклад, до третього знака), то внаслідок цього деякі вибіркові значення можуть збігатися. При цьому величина стрибка емпіричної функції розподілу в точці k дорівнює , де m - кількість вибіркових значень, які збігаються з k, враховуючи й k.
Зауваження 2. Розподіл, що відповідає емпіричній функції розподілу (x), будемо називати емпіричним. При кожному фіксованому це дискретний розподіл, що ставить у відповідність кожній точці k , k = 1, 2, ..., n, масу (або , якщо з k збігаються m вибіркових значень, враховуючи й k ).
За допомогою емпіричної функції розподілу можна одержувати інтуїтивно-наочні оцінки параметрів розподілу.
Нехай 1, 2, ..., n - вибірка з розподілу F( ; ), що залежить від параметра , причому параметр невідомий і його необхідно визначити за вибіркою. Припустимо, що параметр однозначно визначається розподілом (функцією розподілу F(x; ) ), тобто
= ( F(x; ) ),
де - функціонал, заданий на множині функцій розподілу. Наприклад, a = M , 2 = D (коли вони існують) є функціоналами функції розподілу F (x) випадкової величини:
a = x F (dx); 2 = (x - t F (dt))2 F (dx).
Вибірка 1, 2, ..., n визначає емпіричну функції розподілу (x). І оскільки (dx) “близька” до F(x; ) ( при кожному х є незміщеною і спроможною оцінкою F(x; ), а = (F(x; ) ), то для оцінювання параметра природно розглядати величину
= ( (x)).
У такий спосіб, наприклад, для a одержимо оцінку
= x (dx) = ,
для 2
= (x - t (dt))2 (dx) = (i )2 =
Інтеграли обчислюються як інтеграли Лебега за дискретним розподілом, зосередженим у точках 1, 2, ..., n з масою 1 / n в кожній з них.
Означення. Оцінку параметра = ( F(x; )), одержану за формулою = ( (x)), будемо називати емпіричним (вибірковим) значенням параметра .
Зокрема,
=
- емпіричне (вибіркове) середнє,
= 2
– емпірична (вибіркова) дисперсія.
Теорема 2.1 Нехай 1, 2, ..., n - вибірка з розподілу F і g(x) - борелівська функція на R1 зі значенням в R1. Якщо
G = g(x) F (dx) ,
то вибіркове значення величини G
= g(x) (dx) =
є спроможною й незміщеною оцінкою параметра G.