logo search
Основы математической обработки информации / Пособие для фф

7.1.7. Определение минимально достаточного объёма выборки в грамматических, фонетико-фонологических и лексикологических исследованиях.

Величина абсолютной ошибки, которая допускается при использовании частоты события А вместо его вероятности, равна , отсюда . Эта формула применяется при исследованиях употребительности грамматических, фонетических и фонологических единиц, которые обычно дают нормальное распределение и вероятность которых не очень мала.

Пример. По данным предварительного исследования относительная частота употребления мягких согласных фонем в украинских драматургических текстах равна 0,0828. Необходимо при заранее заданных максимальной абсолютной ошибке и надёжности определить минимально достаточный объём выборки для получения достоверных сведений об употребительности мягких согласных фонем в украинских драматургических текстах.

Подставляя данные в предыдущую формулу, получаем

Ответ: объём выборки должен быть больше 60 тыс. фонем.

В ходе лексикологических исследований нужно принять во внимание, что относительные частоты лексических единиц обычно очень малы, следовательно разности близки к 1 и.

Пример. Относительная частота словосочетания split cylinder «разрезной цилиндр» в английских текстах по строительным материалам составляет 0,000175. Необходимо определить минимально достаточный объём выборки, удовлетворяющий надёжности 0,95 и 33% относительной ошибке Ответ: