Понятия выборочной теории. Ряды распределения. Корреляционный и регрессионный анализ
4.1 Корреляционная зависимость
Изучить:
а) виды зависимостей между признаками (функциональная, статистическая, корреляционная);
б) двумерная случайная величина и ее числовые характеристики;
в) момент связи (ковариация) между составляющими X и Y двумерной случайной величины;
г) коэффициент корреляции и его свойства;
д) выборочный коэффициент корреляции;
е) проверка гипотезы о значимости коэффициента корреляции генеральной совокупности.
Корреляционный анализ (correlation analysis) [лат. correlatio -- соотношение] - раздел математической статистики, объединяющий практические методы исследования корреляционной связи между двумя и более случайными признаками или факторами.
Цель корреляционного анализа -- обеспечить получение некоторой информации об одной переменной с помощью другой переменной. В случаях, когда возможно достижение цели, говорят, что переменные коррелируют. В самом общем виде принятие гипотезы о наличии корреляции означает что изменение значения переменной X, произойдет одновременно с пропорциональным изменением значения Y.
Если зависимость между признаками на графике указывает на линейную корреляцию, рассчитывают коэффициент корреляции , который позволяет оценить тесноту связи переменных величин, а также выяснить, какая доля изменений признака обусловлена влиянием основного признака, какая - влиянием других факторов. Коэффициент варьирует в пределах от -1 до +1. Если =0, то связь между признаками отсутствует. Равенство =0 говорит лишь об отсутствии линейной корреляционной зависимости, но не вообще об отсутствии корреляционной, а тем более статистической зависимости. Если = ±1, то это означает наличие полной (функциональной) связи. При этом все наблюдаемые значения располагаются на линии регрессии, которая представляет собой прямую.
Практическая значимость коэффициента корреляции определяется его величиной, возведенной в квадрат, получившая название коэффициента детерминации.
Задание 9
9.1 По выборке X и Y построить поле корреляции и выдвинуть предположение о существовании (или не существовании) зависимости между признаками X и Y.
Рисунок 5
Из рисунка 5 видно, что точки на графике расположены беспорядочно, соответственно можно сделать такой вывод, что корреляционной зависимости между признаками X и Y нет.
9.2 Найти выборочный коэффициент корреляции и подтвердить (опровергнуть) вывод, сделанный в пункте 9.1.
Данные в корреляционной таблице представляют случайную выборку. Статистические числовые характеристики (Sх,Sy), полученные по этой выборке, являются оценками параметров генеральной совокупности, поэтому о тесноте зависимости между признаками X и Y мы судим по величине оценки коэффициента корреляции . Следует проверить его значимость, т.е. установить - достаточна ли его величина при данном объеме выборки (n=20) для вывода о наличии корреляционной зависимости между признаками X и Y.
Выборочный коэффициент корреляции рассчитывается по формуле:
"right">Таблица 11
№ |
X |
Y |
( |
( |
||||
1 |
56 |
77 |
-5,3 |
-3,6 |
28,09 |
12,96 |
19,08 |
|
2 |
58 |
79 |
-3,3 |
-1,6 |
10,89 |
2,56 |
5,28 |
|
3 |
59 |
79 |
-2,3 |
-1,6 |
5,29 |
2,56 |
3,68 |
|
4 |
60 |
79 |
-1,3 |
-1,6 |
1,69 |
2,56 |
2,08 |
|
5 |
60 |
79 |
-1,3 |
-1,6 |
1,69 |
2,56 |
2,08 |
|
6 |
61 |
79 |
-0,3 |
-1,6 |
0,09 |
2,56 |
0,48 |
|
7 |
61 |
79 |
-0,3 |
-1,6 |
0,09 |
2,56 |
0,48 |
|
8 |
61 |
79 |
-0,3 |
-1,6 |
0,09 |
2,56 |
0,48 |
|
9 |
61 |
80 |
-0,3 |
-0,6 |
0,09 |
0,36 |
0,18 |
|
10 |
61 |
80 |
-0,3 |
-0,6 |
0,09 |
0,36 |
0,18 |
|
11 |
61 |
80 |
-0,3 |
-0,6 |
0,09 |
0,36 |
0,18 |
|
12 |
61 |
81 |
-0,3 |
0,4 |
0,09 |
0,16 |
-0,12 |
|
13 |
62 |
81 |
0,7 |
0,4 |
0,49 |
0,16 |
0,28 |
|
14 |
62 |
82 |
0,7 |
1,4 |
0,49 |
1,96 |
0,98 |
|
15 |
62 |
82 |
0,7 |
1,4 |
0,49 |
1,96 |
0,98 |
|
16 |
63 |
82 |
1,7 |
1,4 |
2,89 |
1,96 |
2,38 |
|
17 |
64 |
83 |
2,7 |
2,4 |
7,29 |
5,76 |
6,48 |
|
18 |
64 |
83 |
2,7 |
2,4 |
7,29 |
5,76 |
6,48 |
|
19 |
64 |
84 |
2,7 |
3,4 |
7,29 |
11,56 |
9,18 |
|
20 |
65 |
84 |
3,7 |
3,4 |
13,69 |
11,56 |
12,58 |
Так как значение коэффициента корреляции очень мало, то можно подтвердить предположение, сделанное в п. 9.1 и сказать, что связь слабая.
9.3 Проверить гипотезу о значимости выборочного коэффициента корреляции
Проверим значимость выборочного коэффициента корреляции , т.е. установим достаточна ли его величина при данном объеме выборки для обоснованного вывода о наличии корреляционной связи.
1) H0: =0;
H1: 0
2) - уровень значимости.
3) По распределению Стьюдента:
4) (двусторонняя критическая область)
Вывод: Нулевая гипотеза не отвергается, т.е. между признаками X и Y отсутствует корреляционная зависимость.