logo
Математические методы статистики

1.8 Оценка параметров генеральной совокупности на основе выборочных данных

Расхождение между генеральной и выборочной совокупностями измеряется средней ошибкой выборки, которая рассчитывается следующим образом:

,

где n - число единиц в выборочной совокупности;

N - число единиц в генеральной совокупности.

Среднюю ошибку необходимо знать для того, чтобы определить возможные пределы для средней генеральной совокупности

Суждение о том, что средняя в генеральной совокупности будет лежать в пределах можно гарантировать не с абсолютной точностью, а с некоторой вероятностью.

Для этого рассчитывают предельную ошибку выборки по формуле:

,

где t - коэффициент доверия, определяемый в зависимости от вероятности по таблицам.

Таким образом, показатели генеральной совокупности для генеральной средней при заданной вероятности определяются по показателям выборочной совокупности следующим образом:

Рассчитаем среднюю ошибку для выборки по величине чистых активов:

= 396,52 (млн.руб.)

Найдем предельную ошибку для выборки по кредитным вложениям, принимая вероятность равной 0,95. По таблице находим коэффициент доверия t, равный 1,96.

Д = 396,52 * 1,96 = 777,18 млн.руб.

Таким образом, границы, в которых с вероятностью 0,95 будет находиться среднее значение показателя величины чистых активов, принимают вид:

1528 - 777,18 < хср < 1528 + 777,18

750,82 < хср < 2305,18 млн.руб.

1.9 Построение интервального вариационного ряда по величине прибыли

Построим вариационный ряд распределения по величине прибыли. Число групп определено в предыдущих расчетах и равно 6.

Величина интервала составляет

H = (913 - (-8)) / 6 = 153,5 млн.руб.

В таблице 6 приведена группировка банков по величине чистых активов

Таблица 6

№ группы

Величина прибыли, млн.руб.

Число банков,шт, f

Средняя величина интервала, млн.руб.

Общая величина прибыли в группе, млн.руб.

Средняя величина прибыли в группе, млн.руб.

1

- 8 - 145,5

21

68,75

617

29,4

2

145,5 - 299

6

222,25

1314

219,0

3

299 - 452,5

1

375,75

481

481,0

4

452,5 - 606

0

529,25

0

-

5

606 - 759,5

1

682,75

645

645,0

6

759,5 - 913

1

836,25

913

913,0

Итого

30

3970

132,3

1.10 Построение Графика

Для наглядного изображения интервального ряда распределения построим гистограмму. Она представлена на рисунке 5

Гистограмма распределения банков по величине прибыли

Рис.5

В таблице 6 рассчитана средняя величина прибыли по группировке

Хср = 132,33 млн.руб.

Так же среднюю величину для интервального ряда можно рассчитать по формуле средней арифметической взвешенной. В этом случае ее величина составит

Хср = 155,73 млн.руб.

Как видим две величины, рассчитанные разными способами значительно отличаются друг от друга. В дальнейших расчетах мы будем пользоваться средней величиной прибыли, рассчитанной в таблице 6, поскольку данная величина является более точной.

1.2.в) Расчет показателей вариации

Для характеристики структуры вариации рассчитываем структурные средние: моду и медиану.

Мо = -8 + 153,5*(21-0) / ((21-0) + (21-6)) = 81,54 млн.руб.

Рассчитаем медиану

Ме = -8 + 153,5* (15 - 0) / 21 = 28,55 млн.руб.- данная величина прибыли находится в середине совокупности.

Рассчитаем абсолютные показатели вариации

Размах вариации R = 913 - (- 8) = 921 млн.руб.

В таблице 7 представлены дополнительные расчеты для исчисления показателей вариации

Таблица 7

Величина прибыли, млн.руб.

Число банков,шт, f

Средняя величина интервала, млн.руб.

|х-хср|

|х-хср|*fi

(х-хср)2*fi

- 8 - 145,5

21

68,75

63,6

1335,25

84899,65

145,5 - 299

6

222,25

89,9

539,5

48510,04

299 - 452,5

1

375,75

243,4

243,42

59251,67

452,5 - 606

0

529,25

396,9

0

0,00

606 - 759,5

1

682,75

550,4

550,42

302958,51

759,5 - 913

1

836,25

703,9

703,92

495498,67

Итого

30

2048,2

3372,5

991118,54

Среднее

68,3

112,4

33037,28

Среднее линейное отклонение

D = 144,1 млн.руб. - невзвешенная величина среднего линейного отклонения

D = 112,4 млн.руб. - взвешенная величина среднего линейного отклонения

Дисперсия

у2 = 43 189,42 млн.руб.2 - невзвешенная дисперсия

у2 = 33 037,282 млн.руб.2 - взвешенная дисперсия

Среднее квадратическое отклонение

у = 207,82 млн.руб.- невзвешенное среднее квадратическое отклонение

у = 181,76 млн.руб.- взвешенное среднее квадратическое отклонение

Рассчитаем относительные показатели вариации

Коэффициент осцилляции

VR = 921 / 132,3 * 100 = 696,1%

Относительное линейное отклонение

VD = 144,1 / 132,3 * 100% = 108,9 %

VD = 112,4/ 132,3 * 100% = 84,96 %

Коэффициент вариации

Vу = 207,82 / 132,3 * 100% = 157,1 %

Vу = 181,76 / 132,3 * 100% = 137,38 %

Коэффициент вариации для выборки по величине прибыли значительно больше, чем 33%, следовательно, совокупность неоднородна, а это означает, что среднее значение признака не является центром распределения.

1.11 Определение количественных характеристик распределения (показателей асимметрии и эксцесса)

М3 = 20 997 502,5 - невзвешенный момент третьего порядка

М3 = 17 630 989,7 - взвешенный момент третьего порядка

АS = 20 997 502,5 / 207,823 = 2,34

АS = 20 997 502,5 / 181,763 = 2,94

Найдем соотношение

= 2,34 / 0,412 = 5,67

= 2,94 / 0,412 = 7,14

Данное соотношение в обоих случаях (как при расчете невзвешенной величины, так и при расчете взвешенной величины) значительно больше 3, поэтому асимметрия признается существенной

В симметричных распределениях или распределениях с несущественной асимметрией рассчитывается показатель эксцесса. Поскольку в данном случае имеет место существенная асимметрия, но данный показатель может не рассчитываться.

1.12 Нахождение эмпирической функции, построение ее графика

Построим график эмпирического распределения банков в зависимости от величины прибыли. Для этого по оси абсцисс необходимо откладывать середину интервала значения признака, а по оси ординат, соответствующие ей частоты.

Рис.6

1.13 Определение теоретических частот по закону нормального распределения. Построение графиков

Таблица 8. Расчет теоретических частот

№ п/п

Величина прибыли, млн.руб.

Число банков, fi

Середина интервала, xi

t

ц(t)

Теоретические частоты, f

1

- 8 - 145,5

21

68,75

-0,3498

0,3752

8

2

145,5 - 299

6

222,25

0,4947

0,3521

8

3

299 - 452,5

1

375,75

1,3392

0,1604

4

4

452,5 - 606

0

529,25

2,1837

0,0355

1

5

606 - 759,5

1

682,75

3,0282

0,0041

0

6

759,5 - 913

1

836,25

3,8727

0,0003

0

Итого

30

21

По найденным теоретическим частотам построим график теоретического распределения банков по величине прибыли.

Рис.7

При совмещении графиков теоретического и эмпирического распределения получится следующее:

Рис.8

1.14 Проверка гипотезы о подчинении изучаемых признаков нормальному закону распределения

Для проверки гипотезы о подчинении изучаемых признаков нормальному закону распределения воспользуемся критерием Романовского.

Таблица 9. Расчет значения критерия Пирсона для распределения по величине прибыли

№ п/п

Величина прибыли, млн.руб.

Эмирические частоты, fi

Теоретические частоты, f

(fi-f)2

(fi-f)2/f

1

- 8 - 145,5

21

8

161

19,358

2

145,5 - 299

6

8

3

0,416

3

299 - 452,5

1

4

7

1,836

4

452,5 - 606

0

1

1

0,787

5

606 - 759,5

1

0

1

9,098

6

759,5 - 913

1

0

1

0,000

Итого

Итого

30

21

31,494

Рассчитаем значение критерия Романовского

Р = = 11,63

Поскольку величина критерия Романовского больше 3 (равна 11,63), то гипотеза о распределении банков в зависимости от величины прибыли по закону нормального распределения отвергается.