logo
Konspekt_lektsy

37. Точечное оценивание параметров распределения

Одна из основных целей статистической обработки данных состоит в представлении множества обрабатываемых данных в виде сравнительно небольшого числа сводных характеристик, построенных на основании этих исходных данных. При этом важно, чтобы такое сжатие данных сохраняло по возможности в выбранных характеристиках всю существенную информацию, относящуюся к исследуемому объекту (явлению) и содержащуюся в исходных данных. Упомянутые сводные характеристики являются функциями от исходных результатов наблюдения и называются статистиками.

Распределение исследуемого признака Х характеризуется целым рядом числовых теоретических характеристик или параметров . Сюда относятся среднее значение (математическое ожидание), дисперсия, среднее квадратическое отклонение, моменты и т.д. Они могут быть найдены, если известен закон распределения признака Х. Однако на практике распределение изучаемого признака, как правило, неизвестно или же известно частично (с точностью до некоторых параметров). Поэтому необходимо указать некоторую функцию от исходных данных (или статистику), предназначенную для использования вместо неизвестного теоретического параметра в качестве его приближения. Это приближенное значение параметра называется точечной оценкой параметра (или просто оценкой) и обозначается .

Предположим, что рассматриваемый признак Х – результат изменения некоторой физической постоянной а, при котором систематическая погрешность отсутствует. Из практики известно, что распределение Х, как правило, нормальное с параметрами и . В этом случае вид закона распределения случайного признака Х известен, а оценка неизвестных параметров распределения по выборке заключается в определении по результатам измерений приближенных значения а и .

При изучении случайных признаков часто используются числовые характеристики, позволяющие оценивать такие его свойства, как центр группирования значений исследуемого признака, меру их рассеивания относительно центра группирования, характеристики формы распределения. Так, например, при изучении закона распределения заработной платы работников интересуются в первую очередь средней заработной платой и одной из мер его случайного рассеивания – дисперсией или средним квадратическим отклонением.

Для оценки теоретических характеристик распределения применяются различные выборочные характеристики или статистики. Предположим, что исходные данные сгруппированы и представлены таблицей частот (дискретной или интервальной).

Пусть - значение признака, и центр интервала группировки, если таблица частот интервальная;

− частота, соответствующая i-му значению или i-му интервалу, i = 1, 2, …, k;

− объем выборки; k – число различных выборочных данных или интервалов группировки.

В качестве характеристик центра группирования значений исследуемого признака в статистической практике используют несколько видов средних значений. Средние значения представляют величины, вокруг которых концентрируются наблюдения. Наиболее распространенной средней величиной является выборочная средняя , которая представляет собой среднее арифметическое результатов наблюдения:

.

Основной и наиболее употребительной характеристикой степени рассеяния значений исследуемого признака относительно центра группирования является выборочная дисперсия, которая находится по одной из следующих формул:

или .

Наряду с выборочной дисперсией в качестве характеристики степени рассеяния значений исследуемого признака часто используется выборочное среднее квадратическое отклонение

.

Задача. Вычислить выборочные среднее значение, дисперсию и среднее квадратическое отклонение тарифного разряда рабочих механического цеха по данным задачи из п.35.

Решение. Воспользовавшись формулами для средней выборочной, выборочной дисперсии и выборочного среднего квадратического отклонения, получим:

.