logo
Statistika

Построение линий регрессии

Задача 5.2.

По выборке из двумерного нормального распределения проверить гипотезу независимости компонент наблюдаемого случайного вектора (Х,У). Найти коэффициент корреляции и построить линии регрессии одного из признаков по другому признаку. Найти наилучший прогноз признака У при фиксированном Х=90

Х

33

40

36

60

55

80

95

70

48

53

95

75

63

112

70

У

13,8

13,8

14

22,5

24

28

32

20,9

22

21,5

32

35

24

37,9

27,5

Порядок вычислений

  1. Перенести данные из таблицы на рабочий лист Excel, расположив их в двух столбцах A(данные столбца Х) и B(данные столбца У).

  2. Упорядочить данные по столбцу Х

  3. Посчитать средние значения, стандартные отклонения и число наблюдений для каждого признака (ниже в таблице приведены адреса ячеек, куда необходимо записать данные)

  4. Вычислить коэффициент корреляции (ячейка G5). Использовать функцию

  5. =КОРРЕЛ(диапазон данных для Х; диапазон данных для У)

  6. Проверить значимость найденного коэффициента корреляции. Найти статистику Стьюдента для коэффициента корреляции ( , где - объем выборки, - коэффициент корреляции) и записать результат в ячейку G6 (Использовать функцию =КОРЕНЬ(F4-2)*G5/ КОРЕНЬ(1-G5*G5))

  7. Вычислить критический уровень значимости для двусторонней альтернативы (коэффициент корреляции отличен от нуля) (ячейка G7). Использовать функцию =СТЬЮДРАСП(ABS(G6),F4-2,2). Последний аргумент – число хвостов для двусторонней альтернативы

  8. Сделать вывод о значимости гипотезы независимости (равенства коэффициента корреляции нулю) (ячейка G8)

  9. Вычислить коэффициенты регрессии Х на У (уравнение )

  1. Вычислить коэффициенты регрессии У на Х (уравнение )

  1. Используя прямую регрессии У на Х, вычислить прогноз признака У по значению признака Х=90

Построение графиков линии регрессии

  1. В ячейках С2 и D2 вычислить значение функции регрессии (значение переменной У по значению переменной Х)

  2. =$F$13*A2+$G$13 - регрессия У на Х (уравнение

)

  1. =(A2-$G$12)/$F$12 - регрессия Х на У (уравнение

)

  1. Скопировать ячейки С2 и D2 параллельно данным столбца А

  2. Написать уравнения регрессии X на Y (ячейка F15)

  3. Написать уравнение регрессии Y на X (ячейка F16)

  4. Выделить данные в столбцах A,B,C,D и вызвать мастер построения диаграмм.

  5. Выбрать тип диаграммы «Точечная диаграмма со значениями, соединенными сглаживающими линиями»

  6. После двух нажатий кнопки «Далее» выбрать закладку «Легенда» и удалить из графика легенду

  7. Нажать на кнопку «Готово»

  8. Привести вид полученного графика в соответствие с приведенным выше стандартом:

  9. Убрать маркеры линии регрессии

  10. Написать наименование осей

Характеристика

Адрес ячейки для Х

Адрес ячейки для У

Среднее значение

F2

G2

Стандартное отклонение

F3

G3

Число наблюдений

F4

G4

Коэффициент корреляции

G5

Преобразование Стьюдента

G6

Уровень значимости

G7

Гипотезу независимости следует

принять/отвергнуть

G8

Линии регрессии

Коэффициент

Своб. Член

Х на У

F12

G12

У на Х

F13

G13

Уравнения регрессии

Х на У

У на Х

При Х=90 прогноз значения У

Ниже приводится иллюстрация результатов расчета и графика линий регрессии:

График линий регрессии

Задача 5.3.

Имеются данные по 15 регионам, связывающие капиталовложения в млн. рублей и количеством автотранспортных происшествий

Порядковый номер региона

Капиталовложения в млн. руб

Количество автотранспортных происшествий

1

100

4480

2

98

4500

3

120

4290

4

125

4100

5

137

3400

6

128

3600

7

115

4430

8

132

4700

9

98

3700

10

147

4200

11

112

3730

12

89

3600

13

77

3500

14

120

4100

15

132

3820

Найти коэффициент корреляции и построить линии регрессии одного из признаков по другому признаку.

Задача 5.4.

Имеются данные по 15 студентам, связывающие количество пропущенных занятий в часах и средний балл, полученный студентом по итогам сессии

Порядковый номер студента

Количество пропущенных занятий в часах

Средний балл по всем предметам

1

35

3,85

2

14

4,5

3

48

3,2

4

26

3,9

5

6

5

6

38

3,7

7

56

3

8

32

3,5

9

12

4

10

44

4

11

26

4,2

12

8

3,4

13

16

3,5

14

14

4,1

15

32

3,82

Найти коэффициент корреляции и построить линии регрессии одного из признаков по другому признаку.

Задача 5.5.