logo
Изучение свойств случайных величин, планирование эксперимента и анализ данных

3. Дисперсионный анализ и планирование эксперимента

Рассмотрим в качестве объекта исследования методы измерения прочности. Выберем ультразвуковой неразрушающий метод измерения прочности бетона.

Ультразвуковой метод основан на связи между скоростью распространения ультразвуковых колебаний в бетоне и его прочностью. Прочность бетона в конструкциях определяют по экспериментально установленным градуировочным зависимостям "скорость распространения ультразвука - прочность бетона" или "время распространения ультразвука - прочность бетона" в зависимости от способа прозвучивания.

Градуировочную зависимость "скорость - прочность" устанавливают при испытании конструкций способом сквозного прозвучивания.

На точность измерения прочности при измерении неразрушающими методами могут оказывать влияние такие факторы как: тип цемента, состав цемента, тип заполнителя, условия твердения, возраст бетона, влажность и температура поверхности, тип поверхности, карбонизация поверхностного слоя бетона и еще ряд других менее значимых факторов.

Чем выше скорость распространения ультразвука, тем выше прочность бетона.

3.1 Краткое описание эксперимента

Рассмотрим показатели качества ультразвукового метода измерения прочности и факторы, влияющие на эти показатели.

Исследуемые показатели качества метода измерения прочности:

- Y1 - точность;

- Y2 - скорость ультразвука , 4500-4800 м/с.

Факторы, оказывающие влияние на показатели качества представлены в таблице 8.

Таблица 8 - Факторы и их уровни, изучаемые в эксперименте

Факторы

Уровни факторов

X1- квалификация персонала (A)

- оператор с опытом работы более трех лет (A0);

- оператор с опытом работы менее года(A1);

- оператор без опыта работы (A2);

- студент-практикант (A3);

- (A4).

X2- калибровка прибора (B)

-прибор не прошедший поверку (B0);

- калибровка произведена на влажных образцах (B1);

- калибровка произведена на сухих образцах (B2);

- калибровка прибора произведена не в срок (B3);

- (B4).

X3-производитель (C)

- производитель 1 (C0);

- производитель 2 (C1);

- производитель 3 (C2);

- производитель 4 (C3);

- производитель 5 (C4).

X4- условия проведения испытания (D)

- температура (D0);

- влажность (D1);

- давление (D2);

- загрязнение прибора (D3);

- (D4).

X5- условия хранения испытуемых образцов (E)

- температура, влажность и давление соответствуют указанным в ГОСТ (E0);

- температура не соответствует указанной в ГОСТ (E1);

- влажность не соответствует ГОСТ (E2),

- давление не соответствуют указанному в ГОСТ Е3

- условия не соответствуют (E4).

X6 - вид материала,

Х7 - содержание примесей;

Х8 - возраст бетона;

Х9 - плотность;

Х10 - водоцементное отношение.

Исследуются на постоянном уровне

3.2 Планирование эксперимента

Планирование эксперимента -- комплекс мероприятий, направленных на эффективную постановку опытов. Основная цель планирования эксперимента - достижение максимальной точности измерений при минимальном количестве проведенных опытов и сохранении статистической достоверности результатов.

Полную систему ортогональных латинских квадратов для n=p можно построить, используя поля Галуа. Построим поле Галуа вычетов по модулю 5. В поле содержится пять различных элементов 0, 1, 2, 3, 4, 5. Составим таблицу сложения и умножения в этом поле:

Сложение

Умножение

0

1

2

3

4

1

2

3

4

0

2

3

4

0

1

3

4

0

1

2

4

0

1

2

3

1

2

3

4

2

4

1

3

3

1

4

2

4

3

2

1

Получим второй квадрат путем умножения (К=2)

2*0=0

0

1

2

3

4

2*1=2

2

3

4

0

1

2*2=4

4

0

1

2

3

2*3=1

1

2

3

4

0

2*4=3

3

4

0

1

2

Получим третий квадрат (К=3)

3*1=0

0

1

2

3

4

3*1=3

3

4

1

1

2

3*2=1

1

2

3

4

0

3*3=4

4

0

1

2

3

3*4=2

2

3

4

0

1

Получим четвертый квадрат (К=4)

4*0=0

0

1

2

3

4

4*1=4

4

0

1

2

3

4*2=3

3

4

0

1

2

4*3=2

2

3

4

0

1

4*4=1

1

2

3

4

0

При 5 уровнях в план можно ввести n+1 фактор. Число степеней свободы остаточной суммы будет равно нулю. Такие планы называют насыщенными. Построим насыщенный квадрат для n=5. Наложим для этого четыре полученных выше ортогональных латинских квадрата 55, составляющих полный ряд ортогональных латинских квадратов 55. Полученный план является насыщенным, так как число степеней свободы остаточной суммы, определяемое по формуле где k-число изучаемых факторов, равно нулю.

По этой модели проводится эксперимент из 25 опытов. Такая модель наиболее оптимальна для данного количества факторов, то есть позволяет учесть максимальное количество сочетаний факторов при минимальном количестве опытов.

Таблица 8 - Гипер-греко-латинский квадрат четвертого порядка

А

В

0

1

2

3

4

0

C=0

D=0

E=0

F=0

C=1

D=1

E=1

F=1

C=2

D=2

E=2

F=2

C=3

D=3

E=3

F=3

C=4

D=4

E=4

F=4

1

C=1

D=2

E=3

F=4

C=2

D=3

E=4

F=0

C=3

D=4

E=0

F=1

C=4

D=0

E=1

F=2

C=0

D=1

E=2

F=3

2

C=2

D=4

E=1

F=3

C=3

D=0

E=2

F=4

C=4

D=1

E=3

F=0

C=0

D=2

E=4

F=1

C=1

D=3

E=0

F=2

3

C=3

D=1

E=4

F=2

C=4

D=2

E=0

F=3

C=0

D=3

E=1

F=4

C=1

D=4

E=2

F=0

C=2

D=0

E=3

F=1

4

C=4

D=3

E=2

F=1

C=0

D=4

E=3

F=2

C=1

D=0

E=4

F=3

C=2

D=1

E=0

F=4

C=3

D=2

E=1

F=0

Таблица 9 - Матрица эксперимента n=5, N=25

Номер опыта

А

В

С

D

E

F

X7

X8

X9

X10

1

0

0

0

0

0

0

1

1

1

1

2

0

1

1

1

1

1

1

1

1

1

3

0

2

2

2

2

2

1

1

1

1

4

0

3

3

3

3

3

1

1

1

1

5

0

4

4

4

4

4

1

1

1

1

6

1

0

1

2

3

4

1

1

1

1

7

1

1

2

3

4

0

1

1

1

1

8

1

2

3

4

0

1

1

1

1

1

9

1

3

4

0

1

2

1

1

1

1

10

1

4

0

1

2

3

1

1

1

1

11

2

0

2

4

1

3

1

1

1

1

12

2

1

3

0

2

4

1

1

1

1

13

2

2

4

1

3

0

1

1

1

1

14

2

3

0

2

4

1

1

1

1

1

15

2

4

1

3

0

2

1

1

1

1

16

3

0

3

1

4

2

1

1

1

1

17

3

1

4

2

0

3

1

1

1

1

18

3

2

0

3

1

4

1

1

1

1

19

3

3

1

4

2

0

1

1

1

1

20

3

4

2

0

3

1

1

1

1

1

21

4

0

4

3

2

1

1

1

1

1

22

4

1

0

4

3

2

1

1

1

1

23

4

2

1

0

4

3

1

1

1

1

24

4

3

2

1

0

4

1

1

1

1

25

4

4

3

2

1

0

1

1

1

1

3.3 Проведение модельного эксперимента

Проводим модельные эксперименты с выбранными значениями факторов, фиксируя остальные факторы. Заполняем матрицу эксперимента.

Таблица 10 - Матрица эксперимента n=5, N=25

Номер опыта

А

В

С

D

E

F

X7

X8

X9

X10

Y1

Y2

1

0

0

0

0

0

0

1

1

1

1

23,97

26,37

2

0

1

1

1

1

1

1

1

1

1

31,67

30,37

3

0

2

2

2

2

2

1

1

1

1

51,57

48,37

4

0

3

3

3

3

3

1

1

1

1

87,07

95,47

5

0

4

4

4

4

4

1

1

1

1

209,57

147,57

6

1

0

1

2

3

4

1

1

1

1

84,67

63,37

7

1

1

2

3

4

0

1

1

1

1

173,30

143,67

8

1

2

3

4

0

1

1

1

1

1

95,97

82,17

9

1

3

4

0

1

2

1

1

1

1

76,33

62,37

10

1

4

0

1

2

3

1

1

1

1

55,77

63,47

11

2

0

2

4

1

3

1

1

1

1

51,57

44,17

12

2

1

3

0

2

4

1

1

1

1

73,83

50,37

13

2

2

4

1

3

0

1

1

1

1

177,63

109,97

14

2

3

0

2

4

1

1

1

1

1

148,20

126,27

15

2

4

1

3

0

2

1

1

1

1

99,10

117,37

16

3

0

3

1

4

2

1

1

1

1

237,10

133,37

17

3

1

4

2

0

3

1

1

1

1

94,83

35,87

18

3

2

0

3

1

4

1

1

1

1

75,83

78,87

19

3

3

1

4

2

0

1

1

1

1

221,47

199,37

20

3

4

2

0

3

1

1

1

1

1

105,10

85,37

21

4

0

4

3

2

1

1

1

1

1

240,33

122,87

22

4

1

0

4

3

2

1

1

1

1

206,17

178,37

23

4

2

1

0

4

3

1

1

1

1

242,30

134,17

24

4

3

2

1

0

4

1

1

1

1

96,27

81,47

25

4

4

3

2

1

0

1

1

1

1

261,27

192,47

3.4 Дисперсионный анализ

Дисперсионный анализ является статистическим методом анализа результатов наблюдений, зависящих от различных факторов и оценки их влияния на исследуемый процесс.

С помощью дисперсионного анализа устанавливаются изменения дисперсии результатов эксперимента при изменении уровней изучаемых факторов. Если дисперсии будут отличаться значимо, то следует вывод о значимом влиянии фактора на среднее значение наблюдаемой случайной величины.

Метод дисперсионного анализа основывается на следующих предпосылках: распределение исходных случайных величин нормально; дисперсии экспериментальных данных одинаковы для всех условий эксперимента (т. е. для экспериментов, выполненных на различных уровнях изучаемого фактора).

Поэтому при проведении дисперсионного анализа следует предварительно проверить нормальность распределения и неразличимость дисперсий.

3.4.1 Проверка применимости дисперсионного анализа

- проверим выборки на наличие грубых погрешностей по правилу "трех сигм" по формуле (13):

Для ПК Y1:

При проверке условия (13) для ПК Y1 грубых погрешностей не обнаружено.

Для ПК Y2:

При проверке условия (13) для ПК Y2 грубых погрешностей не обнаружено.

- проверка нормальности полученной выборки

Воспользуемся критерием Дэвида-Хартли-Пирсона.

По формуле (6) вычисляем значение критерия для ПК Y1:

R=Ymax-Ymin=261,26-23,96=237,00

Гипотеза нормальности принимается, если

По таблице 75 [4] для n=25 и находим ;

3,34<3,43<4,71 следовательно условие выполняется, гипотезу о нормальности распределения принимаем на уровне значимости 0,05.

По формуле (6) вычисляем значение критерия для ПК Y2:

R=Ymax-Ymin=199,37-26,37=172,00

По таблице 75 [4] для n=25 и находим ;

3,34<3,44<4,71 следовательно условие выполняется, гипотезу о нормальности распределения принимаем на уровне значимости 0,05. следовательно гипотезу о нормальности распределения принимаем.

- проверка гипотезы о неразличимости дисперсий

Условие однородности дисперсий - это равенство дисперсий. Его проверим по критерию Кохрена:

(18)

Оценка дисперсии определяется по формуле

(19)

Сформируем 5 выборок из ПК Y1 и Y2

Таблица 11 - Оценка дисперсии для ПК Y1

Выборки

1

2

3

4

5

23,97

31,67

51,57

87,07

209,57

84,67

173,30

95,97

76,33

55,77

51,57

73,83

177,63

148,20

99,10

237,10

94,83

75,83

221,47

105,10

240,33

206,17

242,30

96,27

261,27

S2у

10765,81

5187,87

6278,83

3618,32

7335,37

< G кр(5;5;0,05)=0,63

Так как условие Gp<G кр выполняется, то гипотезу об однородности дисперсий принимаем.

Таблица 12 - Оценка дисперсии для ПК Y2

Выборки

1

2

3

4

5

26,37

30,37

48,37

95,47

147,57

63,37

143,67

82,17

62,37

63,47

44,17

50,37

109,97

126,27

117,37

133,37

35,87

78,87

198,37

85,37

122,87

178,37

134,17

81,47

192,47

S2у

2275,83

4680,07

1066,38

2832,19

2601,50

G кр(5;5;0,05)=0,63

Так как условие Gp<G кр выполняется, то гипотезу об однородности дисперсий для ПК Y2 принимаем.

Делаем вывод, что мы можем воспользоваться дисперсионным анализом.

3.4.2 Алгоритм дисперсионного анализа

1) определяем итоги для всех факторов на каждом уровне

Таблица 13 -Итоги по факторам А, B, C, D, E, F

Итоги фактора А

0

1

2

3

4

Y1

403,8333

486,0333

550,3333

734,3333

1046,333

Y2

637,63

579,80

643,30

629,33

730,80

Итоги фактора В

0

1

2

3

4

Y1

348,15

415,05

448,15

531,85

709,35

Y2

390,15

438,65

453,55

563,95

606,25

Итоги фактора С

0

1

2

3

4

Y1

509,93

679,20

477,8

755,2333

798,7

Y2

473,35

543,65

403,05

553,85

478,65

Итоги фактора D

0

1

2

3

4

Y1

521,53

598,43

640,5333

675,6333

784,7333

Y2

358,65

418,65

466,35

558,25

650,65

Итоги фактора Е

0

1

2

3

4

Y1

410,13

496,6667

642,9667

660,6333

1010,467

Y2

343,25

408,25

483,45

532,55

685,05

Итоги фактора F

0

1

2

3

4

Y1

857,63

621,2667

670,2667

531,5333

540,1667

Y2

670,85

447,05

539,85

373,15

421,65

2) Сумма квадратов всех наблюдений:

, (20)

3) Сумма квадратов итогов по каждому из факторов:

, (21)

, (22)

, (23)

, (24)

, (25)

, (26)

4) Квадрат общего итога, деленный на число всех наблюдений (корректирующий член)

, (27)

5) Суммы квадратов, обусловленные фактором:

SSA = SS2 - SS8, (28)

SSB = SS3 - SS8, (29)

SSC = SS4 - SS8, (30)

SSD = SS5 - SS8, (31)

SSE = SS6 - SS8, (32)

SSF = SS7 - SS8, (33)

6) Общая сумма квадратов:

SSобщ = SS1 - SS8, (34)

7) Остаточная сумма квадратов:

SSост = SSобщ - УSSфакт, (35)

8) Дисперсия фактора:

, (36)

9) Дисперсия ошибки:

, (37)

10) Дисперсионное отношение:

, (38)

При расчете SSост исключим из расчета фактор В для Y1 и фактор С для Y2.

Таблица 14 - Результаты расчетов Y1и Y2

Y1

Y2

SS1

550086,46

301007,27

SS2

467247,09

256071,04

SS3

417341,66

247183,42

SS4

431587,31

243584,10

SS5

422537,85

251273,69

SS6

457154,51

254223,11

SS7

429014,46

251672,22

SS8

414959,28

240600,06

SSA

52287,80

15470,98

SSB

2382,37

6583,36

SSC

16628,03

2984,04

SSD

7578,56

10673,63

SSE

42195,23

13623,05

SSF

14055,18

11072,16

SS общ

135127,17

60407,21

SSост

2382,37

2984,04

S?A

13071,95

3867,74

S?B

595,59

1645,84

S?C

4157,01

746,01

S?D

1894,64

2668,41

S?E

10548,80

3405,76

S?F

3513,79

2768,04

S?ош

595,59

746,01

Значимость факторов проверяют по критерию Фишера:

Д.О. = > F 1- p (f1 ,f2) (39)

где р - уровень значимости;

f1 - число степеней свободы фактора, (f1 = 4);

f2 - число степеней свободы остатка, (f2 = 4).

Если дисперсионное отношение удовлетворяет неравенству, то принимаются нулевые гипотезы. Если дисперсионное отношение будет больше табличного, то соответствующая нулевая гипотеза отвергается, и влияние фактора считается значимым.

По таблице 7[2] значение критерия Фишера для всех факторов Y1, Y2:

F 0,05(4;4)=6.4

Таблица15- Итоговая таблица дисперсионного анализа для Y1

Источник дисперсии

Число степеней свободы f

Сумма квадратов

Средний

квадрат

Д.О.

A

4

52287,80

13071,95

21,95

B

4

2382,37

595,59

1,00

C

4

16628,03

4157,01

6,98

D

4

7578,56

1894,64

3,18

E

4

42195,23

10548,80

17,71

F

4

14055,18

3513,79

5,90

Остаток

4

2382,37

595,59

Общая сумма

24

135127,17

На ПК Y1 оказывают влияние факторы: А, С, E.

Таблица16- Итоговая таблица дисперсионного анализа для Y2

Источник дисперсии

Число степеней свободы f

Сумма квадратов

Средний

квадрат

Д.О.

A

4

15470,98

3867,74

5,18

B

4

6583,36

1645,84

2,21

C

4

2984,04

746,01

1,00

D

4

10673,63

2668,41

3,58

E

4

13623,05

3405,76

4,57

F

4

11072,16

2768,04

3,71

Остаток

4

2984,04

746,01

Общая сумма

24

60407,21

На ПК Y2 факторы влияния не оказывают.

3.4.3 Вычисление множественного рангового критерия Дункана

Вычисление критерия Дункана будем производить по тем показателям качества, для которых обнаружено факторное влияние.

В качестве нулевой примем гипотезу Н0: отсутствие значимой разности.

При вычислении критерия Дункана необходимо:

- проранжировать средние значения, расположив их в порядке возрастания

- определить ошибку воспроизводимости результатов с соответствующим числом степеней свободы (таблица 15, 16);

- определить ошибку для каждого среднего по формуле:

(40)

где S2ош - ошибка воспроизводимости результатов.

SY1(А) = SY1(С) = SY1(E)= 10,91

- выписать из таблицы критерия Дункана значения рангов числом k-1 (где k - количество градаций фактора) с выбранным уровнем значимости 0,05 и числом степеней свободы f=4 и умножаем эти ранги на соответствующие ошибки средних.

Таблица 17 - Параметры влияющих факторов

Факторы

Параметры

Значения

Градации

0

1

2

3

4

А

Среднее значение

80,76

97,20

110,06

146,86

209,26

Ранги

3,98

4,01

4,02

4,02

РангSy

43,43

43,76

43,87

43,87

С

Градации

2

0

1

3

4

Среднее значение

95,56

101,98

135,84

151,04

159,74

Ранги

3,98

4,01

4,02

4,02

РангSy

43,43

43,76

43,87

43,87

Е

Градации

0

1

2

3

4

Среднее значение

82,026

99,33

128,59

132,12

202,09

Ранги

3,98

4,01

4,02

4,02

РангSy

43,438

43,76

43,87

43,87

- вычисляем разности средних по градациям и сравниваем полученные значения с соответствующими рангами для нахождения значимости разностей.

А4-A0

642,50

>43,87

различие значимое

A4-A1

560,30

>43,87

различие значимое

A4-A2

496,00

>43,76

различие значимое

A4-A3

312,00

>43,43

различие значимое

A3-A0

330,50

>43,87

различие значимое

A3-A1

248,30

>43,76

различие значимое

A3-A2

184,00

>43,43

различие значимое

A2-A0

146,50

>43,76

различие значимое

A2-A1

64,30

>43,43

различие значимое

A1-A0

82,20

>43,43

различие значимое

C4-C0

64,18

>43,87

различие значимое

C4-C1

119,50

>43,87

различие значимое

C4-C2

320,90

>43,76

различие значимое

C4-C3

43,47

>43,43

различие незначимое

C3-C0

245,30

>43,87

различие значимое

C3-C1

76,03

>43,76

различие значимое

C3-C2

277,43

>43,43

различие значимое

C2-C0

40,28

>43,76

различие незначимое

C2-C1

33,85

>43,43

различие незначимое

различие значимое

C1-C0

6,43

>43,43

различие незначимое

E4-E0

600,33

>43,87

различие значимое

E4-E1

513,80

>43,87

различие значимое

E4-E2

367,50

>43,76

различие значимое

E4-E3

349,83

>43,43

различие значимое

E3-E0

250,50

>43,87

различие значимое

E3-E1

163,97

>43,76

различие значимое

E3-E2

17,67

>43,43

различие значимое

E2-E0

232,83

>43,76

различие значимое

E2-E1

146,30

>43,43

различие значимое

различие значимое

E1-E0

86,53

>43,43

различие значимое

Анализ по критерию Дункана показал, что следующие градации влияющих факторов:

- градации 0, 1, 2, 3, 4 фактора А для показателя качества Y1 являются значимыми

- градации 0, 1, 2, 3, 4 фактора C для показателя качества Y1 являются значимыми

- градации 0, 1, 2, 3, 4 фактора E для показателя качества Y1 являются значимыми