Числові характеристики вибіркового розподілу.
Нехай - вибірка обсягуn з генеральної сукупності з функцією розподілу F(x). Розглянемо вибірковий розподіл, тобто розподіл дискретної випадкової величини , що приймає значення з ймовірностями, рівними 1/n. Числові характеристики цього вибіркового розподілу називаютьсявибірковими (емпіричними) характеристиками.
Слід зазначити ,що вибіркові числові характеристики є характеристиками даної вибірки, але не є характеристиками розподілу генеральної сукупності. Щоб підкреслити це розходження, вибіркові характеристики надалі будемо позначати зі значком * нагорі. Тоді, використовуючи формули параграфа «Числові характеристики випадкових величин» , одержимо
m* = , (45)
D* = . (46)
Для статистичних рядів формули (1) і (2) перетворяться відповідно
m* =,, (47)
D* = . (48)
Обчислимо m* і D* для статистичного ряду, наведеного в Прикладі 20.
Всі обчислення зведемо в Таблицю 6.
Таблиця 6. Допоміжні обчислення
-
0
1
0
0
1
2
2
2
2
3
6
12
3
3
9
27
4
3
12
48
5
2
10
50
14
39
139
Отримані дані підставимо у формули (47) і (48), одержимо
m* = , D* =
Вибірковою модою Md* унімодального ( одновершинного ) розподілу називається елемент вибірки, що зустрічається з найбільшою частотою.
Вибірковою медіаною називається число Mn* , що ділить варіаційний ряд на дві частини, що містять рівне число елементів.
Вибіркові коефіцієнти асиметрії й ексцесу обчислюються за формулами
А* = , (49)
Е* = . (50)
Вибіркові числові характеристики двовимірної вибірки обчислюються як відповідні числові характеристики двовимірного випадкового вектора () дискретного типу, з огляду на те що значення (, i=1,2,…,n, вектор приймає з ймовірностями, рівними 1/n. Вибіркові середній дисперсіїзнаходяться за формулами (45) і (46), а вибірковий коефіцієнт кореляції за формулою
(51)
Приклад 22. Обчислити вибіркові середні, дисперсії й коефіцієнт кореляції для вибірки , наведеної в Таблиці 7.
Таблиця 7. Двовимірного вибірка
-
x
1
2
3
4
5
y
1
1
5
3
4
Обчислення зручно виконувати в наступній послідовності:
,
потім обчислити йі, нарешті. Обчислення звичайно зводяться в Таблицю 8.
Таблиця 8. Допоміжні обчислення
-
1
1
1
1
1
1
4
1
2
3
5
9
25
15
4
3
16
9
12
5
4
25
16
20
1 5
14
55
52
51
Підставляючи знайдені суми у формули (1) і (2) одержимо:
.
Вибіркова лінійна регресія визначається рівнянням
.
Для нашого приклада .
Аналогічно визначається вибіркова лінійна регресія
.
Для нашого приклада
.
Поле точок і прямі регресії зображені на Рисунку 19.
Рисунок 19. Поле точок і прямі регресії
Лекція 14. Методи оцінювання параметрів
Точкові оцінки і їхні властивості. Метод підстановки.
Основне задачі математичної статистики полягає в знаходженні розподілу спостережуваної випадкової величини за даними вибірки. У багатьох випадках вид розподілуможна вважати відомим, і задачі зводиться до одержання наближених значень невідомих параметрів цього розподілу. Нехай - щільність розподілу випадкової величини , що містить один невідомий параметр, а- вибірка спостережень цієї випадкової величини. Точковою оцінкоюпараметраназивається наближене значення цього параметра, отримане за вибіркою. Точкова оцінка виражається числом . Очевидно, що оцінкає значення деякої функції елементів вибірки, тобто
= ().
Будь-яку функцію елементів вибірки називають статистикою. Якість оцінок характеризується наступними основними властивостями:
1) Незміщенність. Оцінка називаєтьсянезміщеною оцінкою параметра , якщо її математичне сподівання дорівнює оцінюваному параметру, тобто М()=.
2) Ефективність. Для оцінки параметра може бути запропоновано кілька незміщених оцінок. Мірою точності незміщеної оцінкивважають її дисперсію D(). Нехай- різні незміщені оцінки параметра. Незміщена оцінкапараметра, дисперсія якої досягає свого найменшого значення, називаєтьсяефективною.
3) Спроможність. Оцінка =() називається спроможною, якщозбігається за ймовірностю допритобто.
Це означає, що при великій кількості спостережень оцінка збігається до дійсного значення параметра.
Найпростіший метод статистичного оцінювання – метод підстановки або аналогії – полягає в тому, що за оцінку тієї або іншої числової характеристики (середнього, дисперсії й ін.) генеральної сукупності приймають відповідну характеристику розподілу вибірки - вибіркову характеристику.
Нехай - вибірка з генеральної сукупності з кінцевими математичним сподіванням m і дисперсією. По методу підстановки одержимо оцінку математичного сподіванняй
= m* = (52)
= D* = (53)
Оцінка є незміщеною й спроможною, а у випадку нормального розподілу генеральної сукупності - ефективною. Оцінкає зміщеною й спроможною , а у випадку нормального розподілу генеральної сукупності – ефективною. Щоб усунути зсув у формулі (53) величину n потрібно замінити на (n-1):
= D*=(54)
Якщо обсяг вибірки n > 30, то можна застосовувати формулу (53) у силу . У випадку спроможності малої вибірки n30, варто застосовувати формулу (54).
- Лекція 9. Багатовимірні випадкові величини………………………………………………..26
- Деякі історичні відомості про виникнення і розвиток теорії ймовірностей.
- Випадкові події Стохастичний експеримент, простір елементарних наслідків
- Умовні ймовірності. Незалежність подій.
- Формула повної ймовірності.
- Послідовність незалежних випробувань. Формула Бернуллі.
- Найімовірніше число появ події.
- Поняття випадкової величини.
- Приклади дискретних розподілів.
- 4. Розподіл Парето
- Центральні моменти.
- Лекція 9. Багатомірні випадкові величини
- Методи статистичного опису результатів спостережень.
- Числові характеристики вибіркового розподілу.
- Інтервальне оцінювання.
- Критерій і його застосування
- Список літератури