Види розподілу ймовірностей й оцінка його параметрів
2. Емпірична функція розподілу
Нехай відомо статистичний розподіл частот кількісної ознаки X. Введемо значення п х -- число спостережень, менше х; п -- загальне число спостережень (обєм вибірки). Ясно, що відносна частота події X <1 дорівнює n(x)/п. Якщо х змінюється, то, взагалі говорячи, змінюється і відносна частота, тобто відносна частота пх /п є функція від х. Тому що ця функція знаходиться емпіричним (досвідченим) шляхом, то її називають емпіричною.
Емпіричною функцією розподілу (функцією розподілу вибірки) називають функцію F*(x), що визначає для кожного значення х відносну частоту випадку X < х.
Отже, по визначенню:
F(x)=nx/n
Де nx-число варіант, менших х; п -- обєм вибірки. Таким чином, для того щоб знайти, наприклад, F*(xi), потрібно число варіант, менших хг, розділити на обєм вибірки: F*(x2) = nx2/n.
На відміну від емпіричної функції розподілу вибірки функцію розподілу F (х) генеральної сукупності називають теоретичною функцією розподілу. Різниця між емпіричної і теоретичної функціями полягає в тому, що теоретична функція F (х) визначає імовірність події X < х, а емпірична функція F* (х) визначає відносну частоту події. З теореми Бернуллі випливає, що відносна частота події X < х, тобто F* (х) прагне по імовірності до імовірності F (х) цієї події. Іншими словами, при великих п числа F* (х) і F (х) мало відрізняються одне від іншого в тому змісті, що lim n-Р [ | F (х)- F* (х) | < е] = 1 (е > 0). Уже звідси випливає доцільність використання емпіричної функції розподілу вибірки для наближеного представлення теоретичної (інтегральної) функції розподілу генеральної сукупності.
Такий висновок підтверджується і тим, що F*(x) наділене усіма властивостями F (х). Дійсно, з визначення функції F* (х) випливають наступні її властивості: 1) значення емпіричної функції належать відрізку [О, 1];
2) F*(x) -- функція, що не спадає;
3) якщо Xi -- найменша варіанта, то F*(x) = Q при xx1; якщо xk--найбільша варіанта, то F* (х) = 1 при x> xk.
Отже, емпірична функція розподілу вибірки служить для оцінки теоретичної функції розподілу генеральної сукупності.
Приклад.
Побудувати емпіричну функцію по даному розподілу вибірки:
варіанти xi 2 6 10
частоти ni 12 18 30
Розвязок. Знайдемо обсяг вибірки: 12 + 18 + 30 = 60. Найменша варіанта дорівнює 2, отже,
F*(x) = О при x2. І
Значення X < 6, а саме x1 = 2, спостерігалося 12 разів, отже,
:F*(x) = 12/60 = 0,2 при
2<x6. I
значення x<10, а саме x1 = 2 і х2 = 6, спостерігалися 12 + 18 = 30 разів, отже,
F* (х) = 30/60 = 0,5 при 6 < х 10. Тому що x=10 -- найбільша варіанта, то | F*(x)=1 при х > 10. Шукана емпірична функція
Графік цієї функції зображений на малюнку.