logo
Теорія ймовірностей Ден

Питання для самоконтролю

  1. Що таке нульова й альтернативна гіпотези?

  2. Що таке критична область і область прийняття гіпотези?

  3. Сформулювати алгоритм перевірки правильності нульової гіпотези. Що таке помилки першого та другого роду?

Література

Обов’язкова: [1]. Додаткова:[1], [4], [7].

Тема 13. Елементи теорії регресії

Мета роботи: навчитися з’ясовувати існування залежності між двома або декількома статистичними ознаками, вміти описати її рівнянням, розуміти зміст параметрів в рівнянні регресії.

План вивчення теми

  1. Рівняння лінійної парної регресії.

  2. Визначення параметрів ,.

  3. Властивості , .

  4. Множинна регресія.

Методичні рекомендації до самостійної роботи

1. Рівняння лінійної парної регресії

Нехай між змінними Х та теоретично існує певна лінійна залежність. Це твердження може ґрунтуватися на тій підставі, наприклад, що кореляційне поле для пар (;) має такий вигляд як на рисунку.

Як бачимо, насправді між ознаками X і спостерігається не такий тісний в'язок, як це передбачає функціональна залежність. Окремі спостережувані значення у, як правило, відхилятимуться від передбаченої лінійної залежності під впливом випадкових збудників, які здебільшого є невідомими. Відхилення від передбаченої лінійної форми зв'язку можуть статися внаслідок неправильної специфікації рівняння, тобто ще з самого початку неправильно вибране рівняння, що описує залежність міжX і .

Рис.1 Кореляційне поле

1

0,9

0,8

0,7

30

29

28

27

26

25

24

23

22

21

20

19

18

17

16

15

14

xi

0

F

0,6

0,55

0,4

0,3

0,2

0,1

30

29

28

27

26

25

24

23

22

21

20

19

18

17

16

15

14

xi

0

ni

0,149

0,069

0,046

0,023

30

29

28

27

26

25

24

23

22

21

20

19

18

17

16

15

14

0

ni

6

5

4

3

2

1

xi

f(x)

F(x)

1

x

8

1

x

1

Хі

-6

-4

1

3

5

8

Рі

0,1

0,2

0,1

0,2

0,2

0,2

F(x)

1

Будемо вважати, що специфікація рівняння вибрана правильно. Ураховуючи вплив на значення збурювальних випадкових факторів, лінійне рівняння і зв'язкуX і можна подати в такому вигляді:

, (14.1)

де ,є невідомі параметри регресії,є випадковою змінною, що характеризує відхилення у від гіпотетичної теоретичної регресії.

Отже, в рівнянні (14.1) значення «» подається у вигляді суми двох частин: систематичноїі випадкової. Параметри,, є невідомими величинами, а, є випадковою величиною, що має нормальний закон розподілу з числовими характеристиками:М() =0, D() ==соnst. При цьому є некорельованими.

У результаті статистичних спостережень дослідник дістає характеристики для незалежної змінної х і відповідні значення залежної змінної у.

Отже, необхідно визначити параметри ,. Але істинні значення цих параметрів дістати неможливо, оскільки ми користуємося інформацією, здобутою від вибірки обмеженого обсягу. Тому знайдені значення параметрів будуть лише статистичними оцінками істинних (невідомих нам) параметрів,. Ці оцінки позначимо,. Тоді моделі (14.1) відповідатиме статистична оцінка

. (14.2)