logo
Точечные оценки параметров статистических распределений

1. Теоретическая часть

Математическая статистика -- наука о математических методах систематизации и использования статистических данных для научных и практических выводов.

Во многих своих разделах математическая статистика опирается на теорию вероятностей, позволяющую оценить надёжность и точность выводов, делаемых на основании ограниченного статистического материала (например: оценить необходимый объём выборки для получения результатов требуемой точности при выборочном обследовании).

Совокупность всех изучаемых объектов называется генеральной совокупностью.

Выборочной совокупностью (выборкой) -- называется совокупность объектов, выбранных из генеральной совокупности случайным образом. Число объектов (наблюдений) генеральной совокупности или выборки называется объемом выборки. Обозначается n.

Выборка должна быть репрезентативной (представительной), то есть она должна сохранять основные черты генеральной совокупности, а не искажать их. Условием представительности является то, что каждый объект выборки выбирается случайным образом независимо от предыдущих.

Точечные оценки параметров статистических распределений.

Точечной называют оценку параметра, которая определяется одним числом.

Генеральной средней называется среднее взвешенное всех значений генеральной совокупности, определяется по формуле:

где к- количество интервалов статических распределений

Выборочной средней называют среднее арифметическое значение признака выборочной совокупности.

где к- количество интервалов статических распределений

Генеральной дисперсией Dг называют среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения.

Генеральным средним квадратическим отклонением (стандартом) называют квадратный корень из генеральной дисперсии:

Выборочной дисперсией называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения.

Выборочным средним квадратическим отклонением называют квадратный корень из выборочной дисперсии:

Выборочная дисперсия является смещенной оценкой генеральной дисперсии, т.е. математическое ожидание выборочной дисперсии не равно оцениваемой генеральной дисперсии, а равно

Для исправления выборочной дисперсии достаточно умножить ее на дробь

получим исправленную дисперсию S2. Исправленная дисперсия является несмещенной оценкой.

Коэффициент асимметрии Аs* статического распределения равен

где m3-центральный момент 3-го порядка.

Эксцесс Ех* статического распределения равен

где m4-центральный момент 4-го порядка.

Интервальные оценки параметров распределения

Интервальной называют оценку, которая определяется двумя числами--концами интервала. Интервальные оценки позволяют установить точность и надежность оценок.

Пусть найденная по данным выборки статистическая характеристика Q* служит оценкой неизвестного параметра Q. Будем считать Q постоянным числом (Q может быть и случайной величиной). Ясно, что Q* тем точнее определяет параметр Q, чем меньше абсолютная величина разности |Q- Q*|. Другими словами, если d>0 и |Q- Q*| <d , то чем меньше d , тем оценка точнее.d-наибольшее отклонение точечной оценки Q от истинного значения .

Таким образом, положительное число d характеризует точность оценки.

Однако статистические методы не позволяют категорически утверждать, что оценка Q* удовлетворяет неравенству |Q- Q*| <d; можно лишь говорить о вероятности g, с которой это неравенство осуществляется.

Надежностью (доверительной вероятностью) оценки называют вероятность g, с которой осуществляется неравенство |Q--Q* | <d .

Обычно надежность оценки задается наперед, причем в качестве g берут число, близкое к единице. Наиболее часто задают надежность, равную 0,9; 0,95 и 0,999.

Пусть вероятность того, что, |Q- Q*| <d равна g:

P(|Q- Q*| <d)= g.

Заменив неравенство равносильным ему двойным неравенством получим:

Р [Q* --d< Q < Q* +d] = g

Это соотношение следует понимать так: вероятность того, что интервал Q* - d< Q < Q* +d заключает в себе (покрывает) неизвестный параметр Q, равна g.

Интервал (Q* - d Q* +d) называется доверительным интервалом, который покрывает неизвестный параметр с надежностью g.

Интервальные оценки параметров нормального распределения

Доверительный интервал для оценки математического ожидания при известном s.

Пусть количественный признак генеральной совокупности распределен нормально. Известно среднее квадратическое отклонение этого распределения -s. Требуется оценить математическое ожидание а по выборочной средней. Найдем доверительный интервал, покрывающий а с надежностью g. Выборочную среднюю будем рассматривать как случайную величину ( она изменяется от выборки к выборке), выборочные значения признака- как одинаково распределенные независимые СВ с математическим ожиданием каждой а и средним квадратическим отклонением s. Примем без доказательства, что если величина Х распределена нормально, то и выборочная средняя тоже распределена нормально с параметрами

.

Потребуем, чтобы выполнялось равенство

Заменив Х и s, получим

получим

Доверительный интервал для оценки дисперсии и среднего квадратического отклонения

Требуется оценить неизвестную генеральную дисперсию и генеральное среднее квадратическое отклонение по исправленной дисперсии, т.е. найти доверительные интервалы, покрывающие параметры D и s с заданной надежностью g.

Потребуем выполнения соотношения

.

Раскроем модуль и получим двойное неравенство:

.

Преобразуем:

.

Обозначим d/s = q (величина q находится по "Таблице значений q"и зависит от надежности и объема выборки), тогда доверительный интервал для оценки генерального среднего квадратического отклонения имеет вид:

.

Замечание : Так как s >0, то если q >1 , левая граница интервала равна 0:

0< s < s ( 1 + q ).

статистика математический интегральный гистограмма