Понятия выборочной теории. Ряды распределения. Корреляционный и регрессионный анализ

курсовая работа

4.1 Корреляционная зависимость

Изучить:

а) виды зависимостей между признаками (функциональная, статистическая, корреляционная);

б) двумерная случайная величина и ее числовые характеристики;

в) момент связи (ковариация) между составляющими X и Y двумерной случайной величины;

г) коэффициент корреляции и его свойства;

д) выборочный коэффициент корреляции;

е) проверка гипотезы о значимости коэффициента корреляции генеральной совокупности.

Корреляционный анализ (correlation analysis) [лат. correlatio -- соотношение] - раздел математической статистики, объединяющий практические методы исследования корреляционной связи между двумя и более случайными признаками или факторами.

Цель корреляционного анализа -- обеспечить получение некоторой информации об одной переменной с помощью другой переменной. В случаях, когда возможно достижение цели, говорят, что переменные коррелируют. В самом общем виде принятие гипотезы о наличии корреляции означает что изменение значения переменной X, произойдет одновременно с пропорциональным изменением значения Y.

Если зависимость между признаками на графике указывает на линейную корреляцию, рассчитывают коэффициент корреляции , который позволяет оценить тесноту связи переменных величин, а также выяснить, какая доля изменений признака обусловлена влиянием основного признака, какая - влиянием других факторов. Коэффициент варьирует в пределах от -1 до +1. Если =0, то связь между признаками отсутствует. Равенство =0 говорит лишь об отсутствии линейной корреляционной зависимости, но не вообще об отсутствии корреляционной, а тем более статистической зависимости. Если = ±1, то это означает наличие полной (функциональной) связи. При этом все наблюдаемые значения располагаются на линии регрессии, которая представляет собой прямую.

Практическая значимость коэффициента корреляции определяется его величиной, возведенной в квадрат, получившая название коэффициента детерминации.

Задание 9

9.1 По выборке X и Y построить поле корреляции и выдвинуть предположение о существовании (или не существовании) зависимости между признаками X и Y.

Рисунок 5

Из рисунка 5 видно, что точки на графике расположены беспорядочно, соответственно можно сделать такой вывод, что корреляционной зависимости между признаками X и Y нет.

9.2 Найти выборочный коэффициент корреляции и подтвердить (опровергнуть) вывод, сделанный в пункте 9.1.

Данные в корреляционной таблице представляют случайную выборку. Статистические числовые характеристики (Sх,Sy), полученные по этой выборке, являются оценками параметров генеральной совокупности, поэтому о тесноте зависимости между признаками X и Y мы судим по величине оценки коэффициента корреляции . Следует проверить его значимость, т.е. установить - достаточна ли его величина при данном объеме выборки (n=20) для вывода о наличии корреляционной зависимости между признаками X и Y.

Выборочный коэффициент корреляции рассчитывается по формуле:

"right">Таблица 11

X

Y

(

(

1

56

77

-5,3

-3,6

28,09

12,96

19,08

2

58

79

-3,3

-1,6

10,89

2,56

5,28

3

59

79

-2,3

-1,6

5,29

2,56

3,68

4

60

79

-1,3

-1,6

1,69

2,56

2,08

5

60

79

-1,3

-1,6

1,69

2,56

2,08

6

61

79

-0,3

-1,6

0,09

2,56

0,48

7

61

79

-0,3

-1,6

0,09

2,56

0,48

8

61

79

-0,3

-1,6

0,09

2,56

0,48

9

61

80

-0,3

-0,6

0,09

0,36

0,18

10

61

80

-0,3

-0,6

0,09

0,36

0,18

11

61

80

-0,3

-0,6

0,09

0,36

0,18

12

61

81

-0,3

0,4

0,09

0,16

-0,12

13

62

81

0,7

0,4

0,49

0,16

0,28

14

62

82

0,7

1,4

0,49

1,96

0,98

15

62

82

0,7

1,4

0,49

1,96

0,98

16

63

82

1,7

1,4

2,89

1,96

2,38

17

64

83

2,7

2,4

7,29

5,76

6,48

18

64

83

2,7

2,4

7,29

5,76

6,48

19

64

84

2,7

3,4

7,29

11,56

9,18

20

65

84

3,7

3,4

13,69

11,56

12,58

Так как значение коэффициента корреляции очень мало, то можно подтвердить предположение, сделанное в п. 9.1 и сказать, что связь слабая.

9.3 Проверить гипотезу о значимости выборочного коэффициента корреляции

Проверим значимость выборочного коэффициента корреляции , т.е. установим достаточна ли его величина при данном объеме выборки для обоснованного вывода о наличии корреляционной связи.

1) H0: =0;

H1: 0

2) - уровень значимости.

3) По распределению Стьюдента:

4) (двусторонняя критическая область)

Вывод: Нулевая гипотеза не отвергается, т.е. между признаками X и Y отсутствует корреляционная зависимость.

Делись добром ;)