logo
Определение данных натуральных наблюдений методами математической статистики

Проверка статистических гипотез

а) Проверка выборок на однородность.

Вопросы удлинения рядов данных натурных наблюдений преследует цель корректировки статистических параметров. Для проверки выборок в сходстве формирования случайных величин используют статистические критерии однородности. Как правило, анализируются выборки попарно. Результатом статистического анализа на однородность является объединение двух выборок в одну или отрицание однородности между сравниваемыми совокупностями. В качестве примера использования статистических критериев однородности при практических расчетах студенты обмениваются выборками и проверяют их на однородность. Для расчетов используются критерии однородности: параметрический - критерий Фишера; непараметрический - критерий Вилкоксона.

Критерий Фишера основан на равенстве дисперсий выборок распределенных приближено нормально. Расчетное значение критерия Фишера определяется по следующей формуле:

причем необходимо выполнение условия D1> D2, где

D1 - дисперсия выборки X (допустим, что выполняется

вышеприведенное условие);

D2 - дисперсия выборки Y (по условию меньше дисперсии выборки X).

Для определения области допустимых значений необходимо задаться уровнем значимости и числом степеней свободы (для практических расчетов уровень значимости принимаем равным 0,05, число степеней свободы рассчитывается по следующей зависимости:

, ;

Используя таблицы F-распределения, определяется критическое значения критерия в зависимости от выбранного уровня значимости и числа степеней свободы. Если выполняется условие, при котором расчетное значение критерия Фишера не превосходит критическое, то можно предположить, что наши ряды однородны и сравниваемые выборки можно объединить в один ряд.

Из непараметрических критериев однородности можно выделить статистический критерий однородности Вилкоксона.

Расчеты проводим в следующем виде и последовательности: значения обеих выборок (Х и Y) упорядочиваются вместе по величине, с учетом выборки из которой взято значение.

Сумма инверсий определяется следующим образом: по построенному вариационному ряду из двух сравниваемых выборок проводят подсчет инверсий (инверсией считается величина, характеризующаяся следующим неравенством хi > yi) т.е. определяют, сколько значений У - выборки находится перед каждым значением Х-выборки. Расчетное значение критерия Вилкоксона определяется по формуле:

Критическое значение статистического критерия однородности Вилкоксона определяется по таблицам или с помощью формулы:

где коэффициент Za определяется по формуле:

,

где Ф0 - функция нормированного и центрированного закона нормального распределения.

Допустим, необходимо сравнить две выборки на принадлежность их одной генеральной совокупности:

Х Y

19.54

19.75

19.87

20.75

20.96

21.05

21.38

21.59

21.76

22.57

22.57

22.66

22.75

22.77

22.83

22.98

23.16

23.52

23.81

24.11

24.31

24.61

24.86

24.88

26.56

28.08

28.24

29.37

29.59

32.54

23.25

23.27

24.22

24.32

24.74

25.32

25.39

25.56

26.07

26.25

26.37

26.51

26.72

26.81

26.81

27.12

27.32

28.03

28.15

28.23

28.28

28.65

29.12

29.83

29.92

30.16

30.33

31.28

31.41

36.86

D1 = 15.675 D2 = 7.1. Критерий Фишера:

Fкр=1.64, > Fкр=> H0

Область допустимых значений определяется в зависимости от уровня значимости и числа степеней свободы: а = 0,05; m1 = 29; m2 - 29. По таблицам F-распределения определяем, что критическое значение критерия Фишера равно 1.64. Так как Fрас> Fкрит, то можно предположить, что наши ряды неоднородны и сравниваемые выборки нельзя объединять. Данное предположение (о принадлежности сравниваемых выборок одной генеральной совокупности) проверим непараметрическим критерием однородности Вилкоксона. Для этого необходимо провести следующие действия:

Величины обеих выборок располагаются в порядке возрастания с учетом того из какой выборки взято значение. Используя рассматриваемый пример получим:

Вариационный ряд двух выборок

1

19,54 (y)

2

19,75 (y)

3

19,87 (y)

4

20,75 (y)

5

20,96 (y)

6

21,05 (y)

7

21,38 (y)

8

21,59 (y)

9

21,76 (y)

10

22,57 (y)

11

22,57 (y)

12

22,66 (y)

13

22,72 (y)

14

22,77 (y)

15

22,83 (y)

16

22,98 (y)

17

23,16 (y)

18

23,25 (x)

19

23,27 (x)

20

23,52 (y)

21

23,81 (y)

22

24,11 (y)

23

24,22 (x)

24

24,31 (y)

25

24,32 (x)

26

24,61 (y)

27

24,74 (x)

28

24,86 (y)

29

24,88 (y)

30

25,32 (x)

31

25,39 (x)

32

25,56 (x)

33

26,07 (x)

34

26,25 (x)

35

26,37 (x)

36

26,51 (x)

37

26,56 (y)

38

26,72 (x)

39

26,81 (x)

40

26,81 (x)

41

27,12 (x)

42

27,32 (x)

43

28,03 (x)

44

28,08 (y)

45

28,15 (x)

46

28,23 (x)

47

28,24 (y)

48

28,28 (x)

49

28,65 (x)

50

29,12 (x)

51

29,37 (y)

52

29,59 (y)

53

29,83 (x)

54

29,92 (x)

55

30,16 (x)

56

30,33 (x)

57

31,28 (x)

58

31,41 (x)

59

32,54 (y)

60

36,86 (x)

u=17+17+20+21+22+24+24+24+24+24+24+24+24+25+25+25+25+25+25+26+26+27+27+27+29+29+29+29+29+29+30=752;

По формулам определяются расчетное и критическое значение критерия Вилкоксона:

;

расчетное значение критерия Вилкоксона равно Врас = 302.

По таблицам нормированной и центрированной кривой нормального распределения определяем аргумент по значению функции (Za = 1,96), критическое значение равно Вкр = 132.57.

Расчетное значение критерия Вилкоксона оказалось меньше критического. С учетом того, что критическая область данного критерия правосторонняя, принимаем нулевую гипотезу, которая подтверждает однородность сравниваемых совокупностей.

Использование критериев согласия преследует цель поиска закона распределения генеральной совокупности, которой принадлежит данная анализируемая выборка. Расчеты проводятся для исходной выборки (X) при N = 30. Цель расчетов заключается в следующем: с помощью критерия согласия Пирсона проверить принадлежность эмпирического материала нормальной кривой распределения (кривая Гаусса). Основные положения по кривой распределения приведены выше.

Как и при проверке однородности выдвигается нулевая гипотеза, но в данном случае она утверждает согласие значений выборки со значениями нормальной кривой распределения, т.е. при увеличении данных натурных наблюдений до бесконечности, распределение случайных чисел отвечает выбранному закону распределения. Расчет по критерию Пирсона основан на определении теоретической частоты в эмпирических интервалах, и если эмпирическая частота и теоретическая отличаются незначительно, то принимается нулевая гипотеза при выбранном уровне значимости и числе степеней свободы. Расчетная формула статистического критерия согласия Пирсона или х2 имеет следующий вид:

где К - количество интервалов; ni - эмпирическая частота; nt - теоретическая частота.

Для того, чтобы использовать аналитические законы распределения, необходимо знать область возможных значений случайных величин (для нормально распределенной случайной величины область возможных значений определяется интервалом (-оо; +оо)). Расчеты сводим в таблицу 4. При этом необходимо выполнить следующее условие: для граничных классов N-Pi > 1, а для внутренних - N-Pi > 5. Если условие не соблюдается, то классы необходимо укрупнять.

Таблица 4

Определение выборочного значения х2рас на согласие эмпирического распределения с нормальным законом распределения.

N

1

2

3

4

5

6

7

8

9

0

-? - 23,25

0

-?

-1,65

-0,5

-0,45

0,05

1,5

-1,5

1,5

1

23,25 - 25.52

7

-1,65

-0,79

-0,45

-0,28

0,16

4,8

2,2

2

25.52 - 27,79

10

-0,79

0,056

-0,28

0,02

0,31

9,3

0,7

3

27,79 - 30,06

8

0,056

0,91

0,02

0,31

0,3

9

-1

4

30,06 - 32,33

4

0,91

1,76

0,31

0,46

0,14

4,2

-0,2

5

32,33 - 34,6

0

1,76

2,62

0,46

0,495

0,035

1,05

-1,05

6

34,6 - 36,87

1

2,62

3,47

0,495

0,499

0,004

0,12

0,88

7

36,87 - +?

0

3,47

+?

0,499

0,5

0,001

0,03

-0,03

0,03

1

30

0

Условные обозначения:

ai - границы интервалов;

ni - эмпирическая частота;

bi - нормированная и центрированная случайная величина:

Ф0 (bi) - значение функции нормального закона распределения на границах интервалов определяется по таблицам;

Pi - теоретическая попадания случайной величины в заданный интервал, Pi = Ф0 (bi) - Ф0 (bi-1);

N-объем выборки, N~ 30;

N-Pi - теоретическая частота.

В результате проведенных расчетов получили искомое расчетное значение критерия Пирсона х2рас =___.

Критическое значение критерия Пирсона определяется по таблицам или по формуле:

где т - число степеней свободы, т = К - 1;

Z2a - коэффициент, определяемый по формуле:

,

0.45, Z2a=1.65.

Учитывая это, критическое значение критерия Пирсона равно: 10,81

Если расчетное значение не превышает критического на выбранном уровне значимости нулевая гипотеза принимается, что подтверждает принадлежность исследуемой выборки нормальному закону распределения: >х2рас, 10,81>

Вывод: условие соблюдается: критическое значение распределения Пирсона больше рассчетного (<10,81) Нулевая гипотеза принимается, эмпирическое распределение согласуется с кривой Гаусса, можно применять все свойства этой кривой и использовать при прогнозировании; выборка принадлежит нормальному закону распределения.