4. Статистическое распределение выборки. Гистограмма.
На практике всегда приходится иметь дело с ограниченным количеством экспериментальных данных, поэтому результаты наблюдений и их обработка содержит больший или меньший элемент случайности. Разработка методов регистрации, описания и анализа таких экспериментальных данных составляет предмет математической статистики.
В математической статистике изучение случайной величины связано с выполнением ряда независимых опытов, в которых она принимает определенное значение. Полученные значения случайной величины представляют простой статистический ряд (простая статистическая совокупность), подлежащий обработке и научному анализу. Общее число членов этого ряда называют его объёмом.
Совокупность, состоящая из всех объектов, которые могут быть к ней отнесены, называется генеральной (количество больных на земном шаре, страдающих гипертонией). Теоретически это бесконечно большая или приближающаяся к бесконечности совокупность. Число объектов генеральной совокупности называется ее объемом N.
Множество объектов, случайно отобранных из генеральной совокупности, называется выборочной совокупностью или выборкой, а число объектов выборки называется ее объемом и обозначается буквой (п).
Первой задачей статистической обработкти экспериментального материала является наведение опреленного порядка в полученном простом статистическом ряду. Поэтому целесообразно расположить данные в порядке возрастания с указанием их повторяемости – составить вариационный ряд. Если количественный признак является дискретным, подсчитывают сколько раз встречается каждое значение признака и результат представляют в виде таблицы:
X | х1 | х 2 | х3 | … | х k |
m | m1 | m2 | m3 | … | mk |
P* = | P*1 | P*2 | P*3 | … | P*k |
Наблюдаемые значения х1,х2, …,хпназывают вариантами. Числаm1,m2, …,mn - называют частотами, а их отношение к объёму выборки относительными частотами: Р*i = .
Сумма всех частот равна объему совокупности п:.
Таблицу, содержащую значение вариант признака, их частоты или относительные частоты, называют дискретным статистическим рядом распределения или статистическим распределением выборки.
В случае большего количества вариант и непрерывности признака дискретный ряд перестает быть удобной формой записи статистического материала. В этом случае производят группировку вариант по интервалам, при этом весь диапазон признака хделят на определенное числоkинтервалов шириной ∆х, подсчитывают частотуmi в каждом интервале, значения, попавшие на конец интервала, относят или к левому или к правому интервалу, определяют Рi* =, и результаты заносят в таблицу, называемую статистическим интервальным рядом:
ИнтервалX | ]хо,х1[ | ]х1,х2[ | … | ]хк-1,хк[ |
m | m1 | m2 | … | mk |
P* | P1* | P2* | … | P*k |
Число интервалов определяется по формуле Стерджесса
k = 1 + 3,332 lg n,
где n– объем выборки, а ширина интервала: ∆х=.
Имея указанную таблицу, на оси 0хоткладывают интервал длиной ∆х, а по оси 0у откладывают плотность относительной частоты. На каждом частотном интервале строят прямоугольник с основанием ∆хи высотой(рис.4). Площадьi-го прямоугольникаSi=. ∆x=Pi*.
Полученную таким образом ступенчатую фигуру, состоящую из прямоугольников, называют гистограммой. Площадь всех прямоугольников будет равна единице.
При неограниченном увеличении числа наблюдений пи уменьшении ширины интервалов верхняя ломанная линия будет стремиться к плавной кривой, ограничивающей площадь, равную единице. В пределе плавная кривая будет графиком плотности вероятности, которая и характеризует плотность распределения случайной величины. При большом числе наблюдений на гистограмме появляются основные статистические закономерности:
Полученные в наблюдениях значения измеряемой величины симметрично расположены около некоторого среднего значения х.
Большие отклонения от среднего хвстречаются реже, чем малые.
Yandex.RTB R-A-252273-3
- 32 Лекция №3 элементы теории вероятности и математической статистики.
- 1.Случайное событие. Вероятность случайного события.
- 2. Случайные величины. Закон распределения и числовые характеристики дискретных случайных величин.
- 3. Непрерывные случайные величины. Нормальный закон распределения (закон Гаусса).
- 4. Статистическое распределение выборки. Гистограмма.
- 5. Обработка результатов прямых и косвенных измерений.
- 6. Понятие о корреляционном анализе.