logo
Определение данных натуральных наблюдений методами математической статистики

Проверка статистических гипотез

Статистические критерии можно разделить на следующие группы: критерии однородности и критерии согласия. С помощью критериев однородности исследователь пытается на основе отрывочных данных удлинить ряд данных натурных наблюдений. Экспериментатор проверяет на однородность несколько рядов натурных наблюдений с целью объединения их в один. Необходимость использования критериев однородности обусловлена стремлением получить более совершенные расчетные параметры кривых распределения (с увеличением объема выборки расчетные величины приобретают количественную стабильность, увеличивается существенность каждой характеристики, проявляются закономерности распределения случайных величин). Критериев однородности достаточно много. Наиболее распространенными в практических расчетах являются критерии Фишера и Стьюдента (параметрические критерии, - в основе которых лежит предположение о принадлежности случайных величин к нормальному закону распределения), из непараметрических можно выделить критерий Вилкоксона (нет предположений о законах распределения сравниваемых выборок).

Критерии согласия позволяют подобрать к эмпирическому распределению конкретное теоретическое. Наиболее распространенным в практических расчетах является критерий Пирсона или X2.

Цель использования критериев заключается в определении закономерностей возникновения случайных величин, их свойств, которые определяют сущность прогнозов и играют важную роль в управлении природными явлениями;

Использование статистических критериев осуществляется следующим образом:

а) Выдвигается нулевая гипотеза (Н0): при использовании критериев, например, однородности - исследуемые ряды однородны. Далее на основании выбранного критерия, пытаемся доказать или опровергнуть выдвинутое предположение (Но).

б) Используя зависимости статистического критерия, получаем расчетное значение критерия.

в) Определение области допустимых значений, т.е. тот промежуток на числовой прямой, на котором подтверждается нулевая гипотеза. Область допустимых значений определяется следующим образом:

· определяют уровень значимости а, характеризующий вероятность ошибочного решения, в практических расчетах его принимаю равным 0,05. При выбранном уровне значимости доверительная вероятность составляет 95%, что удовлетворяет требованиям практических расчетов;

· число степеней свободы (данная величина различна в зависимости от используемого критерия, но в большинстве случаев зависит от объема выборки).

С помощью таблиц или расчетных формул при выбранном уровне значимости и числе степеней свободы рассчитывается критическое значение статистического критерия. Критическое значение характеризует границу между областью допустимых значений и критической областью. Попадание расчетного значения в область допустимых значений подтверждает нулевую гипотезу, исследуемые ряды объединяем в один ряд и проводим статистическую обработку (определяем расчетные параметры). При использовании критериев согласия, если расчетное значение статистического критерия попадает в область допустимых значений, утверждаем, что эмпирическое распределение согласуется с конкретным аналитическим законом распределения, и свойства данного закона распределения можно использовать при анализе данных натурных наблюдений.

3. Порядок выполнений расчетно-графической работы

Допустим, что в результате натурного эксперимента получены следующие количественные значения концентрации конкретного загрязняющего вещества (примерами могут служить нормируемые загрязняющие вещества в окружающей среде: биогены, нефтепродукты, тяжелые металлы, фенолы и т.д.) в определенном пункте контроля. Целью расчета является получение основных статистических характеристик и их анализ, подбор генеральной совокупности по результатам натурных наблюдений.

Исходные данные

30.16

24.32

23.25

29.92

24.74

28.65

24.22

26.07

28.28

25.56

28.15

26.81

26.51

26.25

31.28

36.86

27.12

26.37

26.72

28.03

28.23

23.27

29.12

31.41

26.81

29.83

25.39

25.32

27.32

30.33

Построение вариационного ряда ()

1) Группировка вариационного ряда

а) Определение количества классов (интервалов).

По формуле определяем количество классов, на которое необходимо разделить вариационный ряд:

б) Определение длины каждого класса:

h= 36,86-23,25 =2.27

6

в) Определение границ классов:

1. - границы 1-го интервала;

2. - границы 2-го интервала;

……………………………………………………………

6. - границы 6-го интервала.

Результаты расчёта:

Границы 1-го интервала [23,25 - 25.52]

Границы 2-го интервала [25.52 - 27,79]

Границы 3-го интервала [27,79 - 30,06]

Границы 4-го интервала [30,06 - 32,33]

Границы 5-го интервала [32,33 - 34,6]

Границы 6-го интервала [34,6 - 36,87]

г) Определение частот:

Расчёт выполняем в виде таблицы:

Таблица 1

Границы интервалов,

мг/л

Частота

Ср. арифм. Интервала

, мг/л

1

2

3

4

5

1

23,25 - 25.52

7

24,385

170,695

2

25.52 - 27,79

10

26,655

266,55

3

27,79 - 30,06

8

28,925

231,4

4

30,06 - 32,33

4

31, 195

124,78

5

32,33 - 34,6

0

33,465

0

6

34,6 - 36,87

1

35,735

35,735

30

829,16

3. Определение мер положения, рассеивания и параметров формы кривой распределения

а) Меры положения характеризуют расположение центра распределения выборки: среднее арифметическое, мода, медиана.

б) Меры рассеивания характеризуют отклонение случайной величины от центра распределения и определяются вторым центральным моментом или дисперсией.

в) Характеристики формы кривой распределения определяются при помощи третьего и четвёртого центральных моментов.

Расчет по пунктам "б" и "в" выполняем в виде таблицы 2. С учетом того что ряд вариационный и сгруппированный для расчетов центральных моментов, используем следующую формулу:

;

Таблица 2

Определение центральных выборочных моментов

К

1

2

3

4

5

6

7

8

9

1

7

-3,25

10,56

-34,33

111,57

73,92

-240,31

780,99

2

10

-0,98

0,96

-0,94

0,92

9,6

-9,4

9,2

3

8

1,29

1,66

2,15

2,77

13,28

17,2

22,16

4

4

3,56

12,67

45, 19

160,62

50,68

180,76

642,48

5

0

6,83

46,65

318,61

2176,12

0

0

0

6

1

8,1

65,61

531,44

4304,67

65,61

531,44

4304,67

30

213,09

479,69

5759,5

; ;

;

; ; (>0)

условие не соблюдается, так как ряд короткий)

;