Построение линий регрессии
Задача 5.2.
По выборке из двумерного нормального распределения проверить гипотезу независимости компонент наблюдаемого случайного вектора (Х,У). Найти коэффициент корреляции и построить линии регрессии одного из признаков по другому признаку. Найти наилучший прогноз признака У при фиксированном Х=90
Х | 33 | 40 | 36 | 60 | 55 | 80 | 95 | 70 | 48 | 53 | 95 | 75 | 63 | 112 | 70 |
У | 13,8 | 13,8 | 14 | 22,5 | 24 | 28 | 32 | 20,9 | 22 | 21,5 | 32 | 35 | 24 | 37,9 | 27,5 |
Порядок вычислений
Перенести данные из таблицы на рабочий лист Excel, расположив их в двух столбцах A(данные столбца Х) и B(данные столбца У).
Упорядочить данные по столбцу Х
Посчитать средние значения, стандартные отклонения и число наблюдений для каждого признака (ниже в таблице приведены адреса ячеек, куда необходимо записать данные)
Вычислить коэффициент корреляции (ячейка G5). Использовать функцию
=КОРРЕЛ(диапазон данных для Х; диапазон данных для У)
Проверить значимость найденного коэффициента корреляции. Найти статистику Стьюдента для коэффициента корреляции ( , где - объем выборки, - коэффициент корреляции) и записать результат в ячейку G6 (Использовать функцию =КОРЕНЬ(F4-2)*G5/ КОРЕНЬ(1-G5*G5))
Вычислить критический уровень значимости для двусторонней альтернативы (коэффициент корреляции отличен от нуля) (ячейка G7). Использовать функцию =СТЬЮДРАСП(ABS(G6),F4-2,2). Последний аргумент – число хвостов для двусторонней альтернативы
Сделать вывод о значимости гипотезы независимости (равенства коэффициента корреляции нулю) (ячейка G8)
Вычислить коэффициенты регрессии Х на У (уравнение )
=G5*F3/G3 (ячейка F12, ) - коэффициент наклона прямой регрессии
=F2-F12*G2 (ячейка G12, ) - свободный член
Вычислить коэффициенты регрессии У на Х (уравнение )
=G5*G3/F3 (ячейка F13) - коэффициент наклона прямой регрессии
=G2-F13*F2 (ячейка G13) - свободный член
Используя прямую регрессии У на Х, вычислить прогноз признака У по значению признака Х=90
Построение графиков линии регрессии
В ячейках С2 и D2 вычислить значение функции регрессии (значение переменной У по значению переменной Х)
=$F$13*A2+$G$13 - регрессия У на Х (уравнение
)
=(A2-$G$12)/$F$12 - регрессия Х на У (уравнение
)
Скопировать ячейки С2 и D2 параллельно данным столбца А
Написать уравнения регрессии X на Y (ячейка F15)
Написать уравнение регрессии Y на X (ячейка F16)
Выделить данные в столбцах A,B,C,D и вызвать мастер построения диаграмм.
Выбрать тип диаграммы «Точечная диаграмма со значениями, соединенными сглаживающими линиями»
После двух нажатий кнопки «Далее» выбрать закладку «Легенда» и удалить из графика легенду
Нажать на кнопку «Готово»
Привести вид полученного графика в соответствие с приведенным выше стандартом:
Убрать маркеры линии регрессии
Написать наименование осей
Характеристика | Адрес ячейки для Х | Адрес ячейки для У |
Среднее значение | F2 | G2 |
Стандартное отклонение | F3 | G3 |
Число наблюдений | F4 | G4 |
Коэффициент корреляции |
| G5 |
Преобразование Стьюдента |
| G6 |
Уровень значимости |
| G7 |
Гипотезу независимости следует | принять/отвергнуть | G8 |
|
|
|
Линии регрессии |
|
|
| Коэффициент | Своб. Член |
Х на У | F12 | G12 |
У на Х | F13 | G13 |
| Уравнения регрессии |
|
Х на У |
|
|
У на Х |
|
|
При Х=90 прогноз значения У |
|
|
Ниже приводится иллюстрация результатов расчета и графика линий регрессии:
График линий регрессии
Задача 5.3.
Имеются данные по 15 регионам, связывающие капиталовложения в млн. рублей и количеством автотранспортных происшествий
Порядковый номер региона | Капиталовложения в млн. руб | Количество автотранспортных происшествий |
1 | 100 | 4480 |
2 | 98 | 4500 |
3 | 120 | 4290 |
4 | 125 | 4100 |
5 | 137 | 3400 |
6 | 128 | 3600 |
7 | 115 | 4430 |
8 | 132 | 4700 |
9 | 98 | 3700 |
10 | 147 | 4200 |
11 | 112 | 3730 |
12 | 89 | 3600 |
13 | 77 | 3500 |
14 | 120 | 4100 |
15 | 132 | 3820 |
Найти коэффициент корреляции и построить линии регрессии одного из признаков по другому признаку.
Задача 5.4.
Имеются данные по 15 студентам, связывающие количество пропущенных занятий в часах и средний балл, полученный студентом по итогам сессии
Порядковый номер студента | Количество пропущенных занятий в часах | Средний балл по всем предметам |
1 | 35 | 3,85 |
2 | 14 | 4,5 |
3 | 48 | 3,2 |
4 | 26 | 3,9 |
5 | 6 | 5 |
6 | 38 | 3,7 |
7 | 56 | 3 |
8 | 32 | 3,5 |
9 | 12 | 4 |
10 | 44 | 4 |
11 | 26 | 4,2 |
12 | 8 | 3,4 |
13 | 16 | 3,5 |
14 | 14 | 4,1 |
15 | 32 | 3,82 |
Найти коэффициент корреляции и построить линии регрессии одного из признаков по другому признаку.
Задача 5.5.
- Введение
- Литература
- Элементы теории вероятностей
- Случайное событие и вероятность
- Определение вероятности
- Принцип практической невозможности маловероятных событий
- Формулы комбинаторики
- Условная вероятность
- Независимые события
- Свойства вероятности
- Формула полной вероятности
- Формула Байеса
- Случайная величина
- Свойства математического ожидания
- Дисперсия дискретной с.В.
- Свойства дисперсии
- Закон больших чисел.
- Функция распределения случайной величины
- Свойства функции распределения
- Односторонние и двухсторонние значения вероятностей
- Нормальное распределение
- Взаимосвязи случайных величин Парная корреляция
- Элементы математической статистики
- Генеральная и выборочная совокупность
- Основные шкалы измерений
- Точечные оценки параметров распределения
- Проверка статистических гипотез
- Исследование зависимости между двумя характеристиками
- Лабораторная работа Задание 1. Нахождение выборочных характеристик
- Задача 1.1.
- Задача 1.2.
- Задача 1.3.
- Задача 1.4.
- Задача 1.5.
- Задача 1.6.
- Задание 2 Построение гистограммы выборки
- Задача 2.1
- Задание 3 Проверка статистических гипотез
- Одновыборочный критерий Стьюдента
- Двухвыборочный критерий Стьюдента
- Критерий согласия хи-квадрат
- Задание 4. Интервальные оценки
- Задача 4.1.
- Задача 4.2.
- Анализ значения коэффициента корреляции
- Построение линий регрессии
- Преподавателю и студенту было предложено расположить 15 профессий в порядке их восстребованности на рынке. В результате получилась следующая таблица:
- Оглавление