logo
Исправленный вариант математика

§5. Интервальная оценка. Интервальная оценка

при малой выборке. Распределение Стьюдента

Точечная оценка, особенно при малой выборке, может значительно отличаться от истинных параметров генеральной совокупности. При небольшом объеме выборки пользуются интервальными оценками.

В этом случае указывается интервал (доверительный интервал или доверительные границы), в котором с определенной (доверительной) вероятностью EMBED Equation.3 , которую иногда называют «надежностью», находится истинное значение исследуемой или измеряемой величины, например, среднее значение генеральной совокупности.

Иначе говоря, EMBED Equation.3 определяет вероятность, с которой осуществляются следующие неравенства:

EMBED Equation.3 ,

где положительное число EMBED Equation.3 характеризует точность оценки. Интервал значений от EMBED Equation.3 до EMBED Equation.3 называется доверительным интервалом. Разумеется, чем большей надежности мы требуем, тем большим получается доверительный интервал и, наоборот, чем больший доверительный интервал мы задаем, тем вероятнее, что результаты измерений не выйдут за его пределы.

Сказанное выше относилось к большому числу измерений. При малом числе измерений (условно будем считать, что при n <30) распределение случайных величин носит несколько отличный от закона нормального распределения характер. Это распределение было выявлено в 1908 году английским математиком Госсетом, опубликовавшим работу на эту тему под псевдонимом «Стьюдент» -студент. Естественно, что при данной надежности доверительный интервал при малом числе измерений в серии должен быть шире, чем при большом числе измерений (чем меньше число измерений, тем больше среднее число измерений отличается от математического ожидания) и должен зависеть не только от EMBED Equation.3 , но и от n.Учитывая это, было предложено, в случае небольшого числа измерений, полуширину доверительного интервала (отклонение выборочного среднего от генерального среднего вычислять через S и некоторый параметр EMBED Equation.3 , который называется коэффициентом Стьюдента и который выбирается по заданным EMBED Equation.3 и n по таблицам (см. табл.1):

EMBED Equation.3 ,

но EMBED Equation.3 тогда EMBED Equation.3 < EMBED Equation.3 .

Таблица 1

Значение коэффициента Стьюдента

n 

0.95

0.99

0.999

n 

0.95

0.99

0.999

1

12.706

63.657

636.619

18

2.103

2.878

3.922

2

4.303

9.925

31.598

19

2.093

2.861

3.883

3

3.182

5.841

12.941

20

2.086

2.845

3.850

4

2.776

4.604

8.610

21

2.080

2.831

3.819

5

2.571

4.032

6.859

22

2.074

2.819

3.792

6

2.447

3.707

5.950

23

2.069

2.807

3.767

7

2.365

3.499

5.405

24

2.064

2.797

3.745

8

2.306

3.355

5.041

25

2.060

2.787

3.725

9

2.262

3.250

4.781

26

2.056

2.779

3.707

10

2.228

3.169

4.587

27

2.052

2.771

3.690

11

2.201

3.106

4.487

28

2.048

2.763

3.674

12

2.179

3.055

4.318

29

2.045

2.756

3.659

13

2.160

3.012

4.221

30

2.042

2.750

3.646

14

2.145

2.977

4.140

40

2.021

2.704

3.551

15

2.131

2.947

4.073

60

2.000

2.660

3.460

16

2.120

2.921

4.015

120

1.980

2.617

3.374

17

2.110

2.898

3.965

1.960

2.576

3.291

Анализ табл. 1 для значений коэффициента Стьюдента показывает, что при числе наблюдений 30 и более (большая выборка) при доверительной вероятности 0,95 он оказывается равным 2, при доверительной вероятности 0,997 - EMBED Equation.3 Это означает, что для большой выборки мы опять пришли к нормальному закону распределения или, другими словами, распределение Стьюдента перешло в распределение Гаусса. Приведем (рис.3) график зависимости коэффициента Стьюдента от числа измерений для EMBED Equation.3 , который хорошо иллюстрирует только что сделанный вывод. Достаточно хорошо аппроксимировать его можно зависимостью:

EMBED Equation.3 .

Рис. 3

Yandex.RTB R-A-252273-3
Yandex.RTB R-A-252273-4