logo
ТВ и МС 1 / 04 ТВ и МС Обзорная лекция Бакалавры 2012 / ТВ и МС Обзорная лекция 2011

Тема 9. Основы выборочного метода

В теме 9 «Основы выборочного метода» рассматривается основной метод, используемый в математической статистике. Выборочный метод основан на том, что суждение о свойствах всей совокупности объектов (элементов, единиц), называемой генеральной совокупностью, выносят по некоторой ее части – выборке. Выборка называется репрезентативной(представительной), если она достаточно хорошо воспроизводит генеральную совокупность.

Преимущества выборочного метода по сравнению со сплошным обследованием объектов (в случае, если такое обследование возможно) состоят в экономии всех видов ресурсов, снижении ошибок регистрации, т.е. расхождений между истинным и зарегистрированным значениями признака.

Поэтому выборочный метод широко применяется на практике. Однако значение этой темы значительно шире, поскольку концепция выборки лежит в основе методологии математической статистики. Соотношение между характеристиками выборочной и генеральной совокупностей есть соотношение между опытными данными (результатами наблюдений) и теоретической моделью.

Следует отметить основной недостаток выборочного метода – ошибки репрезентативности (представительства), возникающие только за счет того, что исследуется не вся совокупность, а лишь выборка из нее. Однако эти ошибки могут быть заранее оценены и сведены к практически незначимым величинам. В то же время сплошное наблюдение объектов, даже тогда, когда оно, возможно, приводит к тому, что каждое отдельное наблюдение поневоле проводится с меньшей точностью, что, в конечном счете, может привести к снижению точности сплошного обследования по сравнению с выборочным.

Чтобы по данным выборки иметь возможность судить о всей генеральной совокупности, она должна быть отобрана случайно. На практике случайность отбора элементов в выборку достигается путем жеребьевки (лотереи) или с помощью случайных чисел, имеющихся в специальных таблицах. Обратите внимание на то, что выборочные характеристики – средняядоля w и дисперсия s 2 — величины случайные в отличие от их аналогов в генеральной совокупности – величин неслучайных.

Основной задачей выборочного метода является оценка параметров (характеристик) генеральной совокупности по данным выборки.

Теоретическую основу применимости выборочного метода составляет закон больших чисел, согласно которому при неограниченном увеличении объема выборки п случайные выборочные характеристики приближаются (точнее сходятся по вероятности) к неслучайным параметрам генеральной совокупности.

Обратите внимание на свойства выборочных оценок (или характеристик): несмещенность (когда оценка в среднем совпадает с оцениваемым параметром), состоятельность (когда оценка стремится (точнее сходится по вероятности) к параметру с ростом n ) и эффективность (когда оценка обладает наименьшим рассеянием среди всех несмещенных оценок оцениваемого параметра при данном п). В курсе доказывается, что несмещенными и состоятельными оценками генеральных средней и доли являются их выборочные аналоги – выборочно средняя и доля. При этом следует помнить, что основное требование, предъявляемое к выборочной оценке, заключается в том, чтобы ее рассеяние относительно оцениваемого параметра было минимальным. Для несмещенной оценки это требование означает ее эффективность. Но даже «наилучшая» оценка является лишь приближенным значением неизвестного параметра и, будучи величиной случайной, может существенно отличаться от самого параметра.

Поэтому, наряду с точечными оценками, когда параметр генеральной совокупности оценивается одним числом (например, параметр р числом w ) в математической статистике рассматриваются интервальные оценки.

Интервальной оценкой параметра , называют такой числовой интервал, который с заданной доверительной вероятностью (надежностью) накрывает неизвестное значение параметра. Программой предусматривается построение доверительного интервала для генеральной средней и генеральной доли собственно-случайных выборок. Основой являются формулы доверительной вероятности для средней и доли (учебник [1], § 9.6). Из этих формул следует, в частности, что наибольшее отклонение выборочной средней или доли, которое может произойти с заданной доверительной вероятностью і, предельная ошибка выборкиравна t – кратной величине средней квадратической ошибки, т.е.илигде

Необходимо усвоить три типа задач на выборку, сводящиеся к определению предельной ошибки выборки или границ доверительного интервала, надежности оценки и объема выборки.

При решении задач на нахождение объема выборки следует учесть, что это не просто задачи на вычисление неизвестной величины п из формулы, выражающей предельную ошибку выборки через дисперсию признака. Ведь обычно объем выборки надо знать до проведения выборочного наблюдения, но в этом случае неизвестны не только дисперсии признака Г 2 или pq входящие в формулы объема выборки, но даже их оценки. Поэтому вместо неизвестных значений Г 2 или pq берут их выборочные характеристики s 2 или w ( l – w ) предшествующего исследования в аналогичных условиях. Если никаких сведении o Г 2 или pq нет, то в качестве Г 2 или pq используют их выборочные оценки по специальной пробной выборке небольшого объема, после чего вычисляют объем основной выборки. При оценке генеральной доли вместо проведения пробной выборки можно в формулах объема выборки произведение pq = p ( l – p ) заменить его максимальным значением, равным 0,25.

Если по условию задачи объем бесповторной выборки значительно меньше объема генеральной совокупности, то расчет необходимых характеристик проводят по формулам для повторной выборки.

Yandex.RTB R-A-252273-3