logo search
Учебн

6.4.Дисперсия, среднее квадратичное отклонение

и коэффициент вариации

Средняя арифметическая служит одной из важнейших характеристик вариационного ряда. Но она ничего не говорит о величине вариации характеризуемого признака. Не содержат такой информации и другие рассмотренные средние показатели. А без учета диапазона изменчивости, размаха вариации нельзя дать полную характеристику изучаемого признака.

Рассмотрим пример распределения различных величин, средняя этих величин, рассчитанная по формуле (6.3) равна 10 (табл.6.7),в то же время вариации у них различные.

Таблица 6.7 Средняя величина при разном распределении.

Значение(хi)

4

5

6

7

8

9

10

частота

набл.1

1

1

1

1

2

3

5

набл.2

1

1

3

4

7

набл.3

1

5

13

Чтобы преодолеть недостатки рассмотренного показателя, принято отклонения вариант от средней арифметической возводить в квадрат и сумму квадратов отклонений относить к общему числу наблюдений,т.е. к объему выборки. Этот показатель характеризует дисперсию и выражается следующей формулой:

(6.7.)

При возведении отклонений вариант от средней арифметической в квадрат их сумма не превращается в нуль. Кроме того, большие отклонения от средней будучи возведены в квадрат получают и больший удельный вес, оказывая большее влияние на величину показателя вариации.

Однако, возводя отклонения вариант в квадрат от средней арифметической, мы искусственно увеличиваем и сам показатель вариации. Чтобы преодолеть это берется корень квадратный из указанного отношения. Полученный таким образом показатель называется средним квадратичным отклонением.

(6.8.)

Знаки плюс и минус (+, -), поставленные перед радикалом указывают на то, что данный показатель в равной мере характеризует отклонения вариант от средней арифметической как в сторону больших (+), так и в сторону меньших (-) значений. В дальнейшем эти знаки опущены, подразумевая, что они стоят перед радикалом.

Выборка, в которой рассеяние вариант около средней арифметической больше, характеризуется и большей величиной среднего квадратического отклонения и наоборот.

Из теоретической статистики известно, что вариация генеральной совокупности больше вариации выборки, взятой из данной генеральной совокупности, в среднем в раз. На этом основании в формулу (6.7)следует внести поправку, взяв в качестве множителя подкоренного выражения величину. В результате формула (6.7.) преобразуется следующим образом:

(6.9)

Величина (n-1) называется числом степеней свободы. Она показывает, что в ограниченной совокупности все варианты свободны принимать любые значения, кроме одной, значение которой определяется разностью между суммой всех остальных вариант и объемом выборки. В таких случаях говорят, что одна варианта не имеет степени свободы. Например, если три какие-то значения варьируют неограниченно, то их число степеней свободы

3 - 0=3.

Когда же вариация новых значений ограничена каким-нибудь объемом, например числом равным 50, то две варианты могут принимать любые значения, скажем 20 и 15, а третья варианта будет иметь одно значение

50 - (20+15)=15

то есть она не имеет степени свободы. В этом случае остается только две степени свободы:

3-1=2

В любой эмпирической совокупности всегда имеется один член, не имеющий свободы вариации. Поэтому число степеней свободы для любой выборки равно (n-1). В больших совокупностях разница между n и (n-1) неощутима, она не сказывается на величине среднего квадратического отклонения. На выборках же малого объема эта разница сказывается на величине указанных показателей. Поэтому при вычислении среднего квадратического отклонения на малых выборках рекомендуется пользоваться формулой (6.9). Среднее квадратическое отклонение служит основным показателем вариации признаков. Там, где вариация больше, большим оказывается и среднее квадратическое отклонение, и наоборот. Ценность этого показателя заключается в том, что он не зависит от числа наблюдений и служит надежным мерилом сравнительной оценки однородных и независимо варьирующих величин.

Но так как среднее квадратическое отклонение зависит от абсолютной величины самих вариант и является величиной именованной, его нельзя использовать для сравнительной оценки показателей, выраженных разными единицами меры. Например, два предприятия выпускают одинаковую продукцию, но на одном предприятии выпуск продукции выражается в стоимости, на другом в объеме выпуска продукции, в этом случае сравнение в изменении выпуска продукции затруднительно.

Указанный недостаток среднего квадратического отклонения, как мерила изменчивости признаков устраняется, если выразить этот показатель в процентах от величины средней арифметической данного распределения, Полученный таким образом показатель называется коэффициентом вариации и обозначается буквой С:

(6.10)

Преимущество этого показателя заключается в том, что он – число относительное, а это позволяет использовать его для самых широких сравнений варьирующих величин.

В теоретической и прикладной статистике большое значение имеет нормирование, позволяющее использовать среднее квадратическое отклонение для оценки отдельных вариант по отношению к их средней величине данной совокупности. Такого рода оценка производится по разности между вариантой и средней арифметической, отнесенной к величине среднего квадратического отклонения, т.е.

(6.11.)

Здесь t – называется нормированным отклонением. Этот показатель (значение которого все больше будет раскрываться по мере дальнейшего изложения материала) удобен и прост как при оценке единичных вариант, так и при относительной характеристике сравниваемых друг с другом индивидов.