logo
Konspekt_lektsy

38. Свойства статистических оценок

Для оценки одного и того же параметра можно построить, исходя из выборки различные оценки. Например, чтобы оценить математическое ожидание , можно рассматривать либо среднее арифметическое из выборочных данных, либо полусумму наибольшего и наименьшего наблюдений, либо какую-нибудь другую функцию от выборки. В связи с этим возникает вопрос о требованиях, которые следует предъявлять к оценкам параметров распределения, чтобы они были в каком-то определенном смысле наилучшими. Эти требования выражаются следующими свойствами оценок: несмещенностью, состоятельностью и эффективностью.

Всякая оценка неизвестного параметра по выборке является функцией от выборочных данных . Величины можно рассматривать как случайные величины. Поэтому и оценка является случайной величиной. В этой связи, можно говорить о распределении и числовых характеристиках как выборочных данных, так и оценок.

Поскольку наблюдения над случайным признаком Х предполагаются независимыми, то их результаты , рассматриваемые как случайные величины, будут независимыми и одинаково распределенными со случайной величиной Х. Все числовые характеристики случайных величин и Х совпадают. В частности,

,

.

Оценка параметра называется несмещенной, если математическое ожидание оценки совпадает с оцениваемым параметром :

.

В противном случае оценка называется смещенной. Условие несмещенности также называют условием отсутствия систематических ошибок , и его смысл состоит в том, что при многократном использовании вместо параметра его оценки среднее значение приближения равно нулю.

Если оценка является смещенной, то, вычислив ее математическое ожидание и введя поправочный коэффициент, можно получить несмещенную оценку.

Докажем, что несмещенной оценкой генеральной (теоретической) средней является выборочная средняя .

В самом деле, в силу свойств математического ожидания

.

Теперь рассмотрим выборочную дисперсию

Таким образом, где .

Так как (i = 1, 2, …, k) и , то по свойствам математического ожидания и дисперсии получаем

.

В силу независимости и равенства имеем

.

Подставляя выражение для в выражение для , получаем

.

Таким образом, выборочная дисперсия является смещенной оценкой для теоретической (генеральной) дисперсии .

Несмещенной оценкой теоретической дисперсии является величина

,

называемая исправленной выборочной дисперсией.

Докажем, что если известна генеральная средняя а, то несмещенной оценкой теоретической дисперсии является величина

.

В самом деле, используя свойства математического ожидания, определение дисперсии, равенства и , получим

.

Оценка параметра называется состоятельной, если с ростом объема выборки n она сходится по вероятности к оцениваемому параметру :

при любом сколь угодно малом .

Имеют место следующие факты:

  1. Выборочная средняя является состоятельной оценкой теоретической средней , поскольку согласно закону больших чисел среднее арифметическое n независимых одинаково распределенных случайных величин сходится по вероятности при к их общему математическому ожиданию :

;

  1. При известной теоретической средней выборочная дисперсия является состоятельной оценкой теоретической дисперсии . Действительно, согласно закону больших чисел, среднее арифметическое n независимых одинаково распределенных случайных величин сходится по вероятности при к их общему математическому ожиданию :

;

Требование состоятельности оценки является по существу минимальным требованием, которое обычно предъявляется к оценкам. Условие состоятельности представляется необходимым для того, чтобы оценка имела практический смысл, так как в противном случае увеличение объема исходной информации не будет приближать нас к оцениваемой величине.

Представим себе, что мы имеем две несмещенные и состоятельные оценки и неизвестного параметра . Разумеется, мы хотели бы выбрать ту из них, которая ближе к параметру . Поскольку величины и случайные, то не приходится говорить об обычной мере «близости» и к : случайные величины и характеризуются множеством возможных значений. Для того, чтобы оценка была возможна ближе к параметру , необходимо, чтобы разброс значений величины около был возможно меньшим. Наиболее удобной и распространенной мерой разброса служит математическое ожидание , совпадающая для несмещенных оценок (для которых ) с дисперсией .

Оценка параметра называется более эффективной, чем , если . Для несмещенных оценок и последнее неравенство перепишется в виде . В силу сказанного выше наилучшей оценкой параметра среди всех несмещенных оценок является та из них, которая обладает минимальной дисперсией. Такая оценка называется эффективной.