logo search
645145

Гистограмма

Как мы видели, эмпирическая функция распределения является одним из способов представления статистических данных. Другим способом наглядного представления статистических данных являются гистограммы.

Для построения гистограммы область значений случайной величины разбивают на равные интервалы. Для заданной реализации x=(x1,...,xn). выборки x подсчитывают число координат xi, попавших в соответствующие интервалы, и на каждом интервале, как на основании, строят прямоугольник с высотой , где h- длина интервала, - число элементов выборки, попавших в данный интервал. Полученную при этом фигуру называют гистограммой.

Поскольку площадь каждого полученного прямоугольника равна , т.е. относительной частоте попадания выборочных значений в соответствующий интервал, по теореме Бернулли эта частота сходится при к вероятности попадания случайной величины в соответствующий интервал. Таким образом, при большом значении объема выборки n и достаточно малом h высоты построенных прямоугольников можно рассматривать в качестве приближенных значений для плотности p(x).

Отсюда следует, что верхнюю границу гистограммы можно рассматривать как статистический аналог плотности распределения наблюдаемой случайной величины. Однако, гистограмму рекомендуется применять на предварительном этапе анализа статистических данных.

В методе гистограмм неизвестная плотность распределения приближается кусочно-постоянным графиком. Если плотность p(x)- достаточно гладкая, то, как известно, такие функции лучше приближать кусочно-линейными функциями. Итак, полигон частот это ломаная, которая строится так: если построена гистограмма, то ординаты, соответствующие средним точкам интервалов, последовательно соединяют отрезками прямых. Построенный таким образом кусочно-линейный график также является статистическим аналогом теоретической плотности.

Приведем пример графической обработке данных эксперимента. Так, пусть в результате измерения некоторой величины получены следующие данные:

2

3

5

6

10

15

20

25

30

5

6

10

15

20

24

20

10

5

Для построения гистограммы область значений случайной величины X разобьем на равные интервалы. Поскольку область значений величины Х находится в промежутке [2, 30], то нам удобнее будет изображать гистограмму взяв в качестве исходного промежутка множество [0, 30]. Это множество разобьем на 6 частей точками 5, 10,15,20,25. Затем подсчитаем -(j=1,2,3,4,5,6) – количество координат попавших соответственно в промежутки

I1=[0, 5), I2=[5, 10), I3=[10, 15), I4=[15, 20), I5=[20, 25), I6=[25, 30].

Так в нашем случае =11, =25, =20, =24, =20, =15. Поскольку объем нашей выборки равен = =120 , то нам остается на каждом из интервалов Ij построить прямоугольники с высотой , где - длина интервалов Ij.

Выбрав подходящий масштаб по оси Оу мы получим следующую гистограмму:

В заключение рассмотрим плотности некоторых, часто встречающиеся, распределений:

Нормальное (два неизвестных параметра): .

Равномерное (два неизвестных параметра): .

Биномиальное (один неизвестный параметр): , .

Пуассоновское (один неизвестный параметр): , .