logo
Теория_вероятностей1 / Конспект лекцій по ТВиМС

Числові характеристики вибіркового розподілу.

Нехай - вибірка обсягуn з генеральної сукупності з функцією розподілу F(x). Розглянемо вибірковий розподіл, тобто розподіл дискретної випадкової величини , що приймає значення з ймовірностями, рівними 1/n. Числові характеристики цього вибіркового розподілу називаютьсявибірковими (емпіричними) характеристиками.

Слід зазначити ,що вибіркові числові характеристики є характеристиками даної вибірки, але не є характеристиками розподілу генеральної сукупності. Щоб підкреслити це розходження, вибіркові характеристики надалі будемо позначати зі значком * нагорі. Тоді, використовуючи формули параграфа «Числові характеристики випадкових величин» , одержимо

m* = , (45)

D* = . (46)

Для статистичних рядів формули (1) і (2) перетворяться відповідно

m* =,, (47)

D* = . (48)

Обчислимо m* і D* для статистичного ряду, наведеного в Прикладі 20.

Всі обчислення зведемо в Таблицю 6.

Таблиця 6. Допоміжні обчислення

0

1

0

0

1

2

2

2

2

3

6

12

3

3

9

27

4

3

12

48

5

2

10

50

14

39

139

Отримані дані підставимо у формули (47) і (48), одержимо

m* = , D* =

Вибірковою модою Md* унімодального ( одновершинного ) розподілу називається елемент вибірки, що зустрічається з найбільшою частотою.

Вибірковою медіаною називається число Mn* , що ділить варіаційний ряд на дві частини, що містять рівне число елементів.

Вибіркові коефіцієнти асиметрії й ексцесу обчислюються за формулами

А* = , (49)

Е* = . (50)

Вибіркові числові характеристики двовимірної вибірки обчислюються як відповідні числові характеристики двовимірного випадкового вектора () дискретного типу, з огляду на те що значення (, i=1,2,…,n, вектор приймає з ймовірностями, рівними 1/n. Вибіркові середній дисперсіїзнаходяться за формулами (45) і (46), а вибірковий коефіцієнт кореляції за формулою

(51)

Приклад 22. Обчислити вибіркові середні, дисперсії й коефіцієнт кореляції для вибірки , наведеної в Таблиці 7.

Таблиця 7. Двовимірного вибірка

x

1

2

3

4

5

y

1

1

5

3

4

Обчислення зручно виконувати в наступній послідовності:

,

потім обчислити йі, нарешті. Обчислення звичайно зводяться в Таблицю 8.

Таблиця 8. Допоміжні обчислення

1

1

1

1

1

1

4

1

2

3

5

9

25

15

4

3

16

9

12

5

4

25

16

20

1

5

14

55

52

51

Підставляючи знайдені суми у формули (1) і (2) одержимо:

.

Вибіркова лінійна регресія визначається рівнянням

.

Для нашого приклада .

Аналогічно визначається вибіркова лінійна регресія

.

Для нашого приклада

.

Поле точок і прямі регресії зображені на Рисунку 19.

Рисунок 19. Поле точок і прямі регресії

Лекція 14. Методи оцінювання параметрів

Точкові оцінки і їхні властивості. Метод підстановки.

Основне задачі математичної статистики полягає в знаходженні розподілу спостережуваної випадкової величини за даними вибірки. У багатьох випадках вид розподілуможна вважати відомим, і задачі зводиться до одержання наближених значень невідомих параметрів цього розподілу. Нехай - щільність розподілу випадкової величини , що містить один невідомий параметр, а- вибірка спостережень цієї випадкової величини. Точковою оцінкоюпараметраназивається наближене значення цього параметра, отримане за вибіркою. Точкова оцінка виражається числом . Очевидно, що оцінкає значення деякої функції елементів вибірки, тобто

= ().

Будь-яку функцію елементів вибірки називають статистикою. Якість оцінок характеризується наступними основними властивостями:

1) Незміщенність. Оцінка називаєтьсянезміщеною оцінкою параметра , якщо її математичне сподівання дорівнює оцінюваному параметру, тобто М()=.

2) Ефективність. Для оцінки параметра може бути запропоновано кілька незміщених оцінок. Мірою точності незміщеної оцінкивважають її дисперсію D(). Нехай- різні незміщені оцінки параметра. Незміщена оцінкапараметра, дисперсія якої досягає свого найменшого значення, називаєтьсяефективною.

3) Спроможність. Оцінка =() називається спроможною, якщозбігається за ймовірностю допритобто.

Це означає, що при великій кількості спостережень оцінка збігається до дійсного значення параметра.

Найпростіший метод статистичного оцінювання – метод підстановки або аналогії – полягає в тому, що за оцінку тієї або іншої числової характеристики (середнього, дисперсії й ін.) генеральної сукупності приймають відповідну характеристику розподілу вибірки - вибіркову характеристику.

Нехай - вибірка з генеральної сукупності з кінцевими математичним сподіванням m і дисперсією. По методу підстановки одержимо оцінку математичного сподіванняй

= m* = (52)

= D* = (53)

Оцінка є незміщеною й спроможною, а у випадку нормального розподілу генеральної сукупності - ефективною. Оцінкає зміщеною й спроможною , а у випадку нормального розподілу генеральної сукупності – ефективною. Щоб усунути зсув у формулі (53) величину n потрібно замінити на (n-1):

= D*=(54)

Якщо обсяг вибірки n > 30, то можна застосовувати формулу (53) у силу . У випадку спроможності малої вибірки n30, варто застосовувати формулу (54).