logo
Lektsia_03

4. Статистическое распределение выборки. Гистограмма.

На практике всегда приходится иметь дело с ограниченным количеством экспериментальных данных, поэтому результаты наблюдений и их обработка содержит больший или меньший элемент случайности. Разработка методов регистрации, описания и анализа таких экспериментальных данных составляет предмет математической статистики.

В математической статистике изучение случайной величины связано с выполнением ряда независимых опытов, в которых она принимает определенное значение. Полученные значения случайной величины представляют простой статистический ряд (простая статистическая совокупность), подлежащий обработке и научному анализу. Общее число членов этого ряда называют его объёмом.

Совокупность, состоящая из всех объектов, которые могут быть к ней отнесены, называется генеральной (количество больных на земном шаре, страдающих гипертонией). Теоретически это бесконечно большая или приближающаяся к бесконечности совокупность. Число объектов генеральной совокупности называется ее объемом N.

Множество объектов, случайно отобранных из генеральной совокупности, называется выборочной совокупностью или выборкой, а число объектов выборки называется ее объемом и обозначается буквой (п).

Первой задачей статистической обработкти экспериментального материала является наведение опреленного порядка в полученном простом статистическом ряду. Поэтому целесообразно расположить данные в порядке возрастания с указанием их повторяемости – составить вариационный ряд. Если количественный признак является дискретным, подсчитывают сколько раз встречается каждое значение признака и результат представляют в виде таблицы:

X

х1

х 2

х3

х k

m

m1

m2

m3

mk

P* =

P*1

P*2

P*3

P*k

Наблюдаемые значения х1,х2, …,хпназывают вариантами. Числаm1,m2, …,mn - называют частотами, а их отношение к объёму выборки относительными частотами: Р*i = .

Сумма всех частот равна объему совокупности п:.

Таблицу, содержащую значение вариант признака, их частоты или относительные частоты, называют дискретным статистическим рядом распределения или статистическим распределением выборки.

В случае большего количества вариант и непрерывности признака дискретный ряд перестает быть удобной формой записи статистического материала. В этом случае производят группировку вариант по интервалам, при этом весь диапазон признака хделят на определенное числоkинтервалов шириной ∆х, подсчитывают частотуmi в каждом интервале, значения, попавшие на конец интервала, относят или к левому или к правому интервалу, определяют Рi* =, и результаты заносят в таблицу, называемую статистическим интервальным рядом:

ИнтервалX

]хо,х1[

]х1,х2[

]хк-1,хк[

m

m1

m2

mk

P*

P1*

P2*

P*k

Число интервалов определяется по формуле Стерджесса

k = 1 + 3,332 lg n,

где n– объем выборки, а ширина интервала: ∆х=.

Имея указанную таблицу, на оси 0хоткладывают интервал длиной ∆х, а по оси 0у откладывают плотность относительной частоты. На каждом частотном интервале строят прямоугольник с основанием ∆хи высотой(рис.4). Площадьi-го прямоугольникаSi=. ∆x=Pi*.

Полученную таким образом ступенчатую фигуру, состоящую из прямоугольников, называют гистограммой. Площадь всех прямоугольников будет равна единице.

При неограниченном увеличении числа наблюдений пи уменьшении ширины интервалов верхняя ломанная линия будет стремиться к плавной кривой, ограничивающей площадь, равную единице. В пределе плавная кривая будет графиком плотности вероятности, которая и характеризует плотность распределения случайной величины. При большом числе наблюдений на гистограмме появляются основные статистические закономерности:

  1. Полученные в наблюдениях значения измеряемой величины симметрично расположены около некоторого среднего значения х.

  2. Большие отклонения от среднего хвстречаются реже, чем малые.

Yandex.RTB R-A-252273-3