2.2. Начальные понятия теории вероятностей
Теория вероятностей – раздел математики, изучающий закономерности, присущие массовым случайным явлениям.
Предметом теории вероятностей являются математические модели случайных явлений.
Цель – осуществление прогноза в области случайных явлений.
Возникновение теории вероятностей как науки относится к XVII веку и связано с такими именами, как Галилей, Гюйгенс, Паскаль, Ферма, Якоб Бернулли.
«Познавательная ценность теории вероятностей обусловлена тем, что массовые случайные явления в своём совокупном действии создают строгие закономерности. Само понятие математической вероятности было бы бесплодно, если не находило бы своего осуществления в виде частоты появления какого-либо результата при многократном повторении однородных условий». (Из предисловия А.Н. Колмогорова к сочинению Я. Бернулли «О законе больших чисел». М.: Наука, 1986. С.4).4
В середине XIX – начале XX века вероятностно-статистические методы стали применяться в филологии в работах таких учёных, как И.А. Бодуэн де Куртенэ, А.М. Пешковский, М.Н. Петерсон, Е.Д. Поливанов, В.В. Виноградов и других.
Б.Н. Головин в труде «Язык и статистика» указывает основания вероятностно-статистического изучения языка и речи.5
1) Объективная присущность языку количественных признаков, количественных характеристик (анализ всех грамматических категорий устанавливает их относительный функциональный вес в разных стилях литературного языка, соотношения между словами, слогами и фонемами позволяют дать классификацию языков, которую можно использовать и при изучении их истории).
2) Внутренняя зависимость, существующая между качественными и количественными характеристиками языковой структуры (количественные различия на низшем уровне дают качественные различия на высшем уровне: количество фонем в языке отражается на качестве морфем и слов, количество морфем – на качестве слов, количественные характеристики на морфологическом уровне дают о себе знать в качестве синтаксических явлений).
3) Частоты различных элементов подчиняются статистическим законам (полученные опытным путём данные о частотах и вероятностях частей речи, некоторых типов предложений, формах глагола говорят о колебаниях частоты каждого изучавшегося элемента языка около некоторой средней величины, причём колебания эти статистически закономерны).
«Язык может рассматриваться как структура, элементы которой и функционируют в речи и развиваются, подчиняясь тем или иным вероятностно-статистическим законам». 6
К числу первичных понятий теории вероятностей относятся:
1) Опыт со случайным исходом или испытание - совокупность условий, при которых данное событие может произойти, а может и не произойти.
Классическими примерами опытом со случайным исходом являются: подбрасывание монеты с выяснением того, выпадет «орел» или «решка»; подбрасывание игральной кости с выяснением количества выпавших очков или их четности; шара определенного цвета из урны с шарами нескольких цветов. В лингвистике в качестве такого опыта можно рассматривать опыт появления определенного количества глаголов в фрагменте из стихов некоторого поэта и т.п.
2) Исход опыта (элементарное событие) – результат опыта со случайным исходом, вероятность (степень ожидания) которого считается известной.
Так, в математике считается, что опыт с подбрасыванием монеты имеет всего два элементарных исхода, вероятности которых одинаковы (и составляют 0,5), так как монета правильная (имеет форму цилиндра, везде одинаковой плотности, ее центр тяжести расположен в середине отрезка, соединяющего центры оснований цилиндра).
Описание опыта может быть заменено описанием множеством всех его элементарных исходов. Так, например, опыт с подбрасыванием игральной кости может быть заменен множеством из 6 равновероятных элементарных исходов (вероятность каждого 1/6) – количества выпавших очков; или множеством из 2 равновероятных элементарных исходов – выпало четное количество очков или нечетное (вероятность каждого 0,5).
3) Случайное событие – это любое подмножество множества всевозможных элементарных исходов опыта.
Достоверное случайное событие – произойдёт обязательно при данном испытании, так как равно самому множеству всевозможных исходов опыта. Невозможное
в) невозможное - никогда не произойдёт при данном испытании.
Примеры:
А=«выпало число 6 на игральной кости» - случайное событие;
В=«извлекли белый шар из урны с белыми и красными шарами» - случайное событие;
С=«извлекли белый шар из урны с белыми шарами» - достоверное событие;
D=«извлекли белый шар из урны с синими шарами» - невозможное событие;
E=«в произвольно взятом отрывке текста данного автора длиной 100 словоформ содержится 12 глаголов» - случайное событие.
3) Совместные события могут произойти вместе при одном испытании, несовместные – не могут произойти вместе.
Пример:
событие А = «попал по мишени 1-й стрелок» и событие В = «попал по мишени 2-й стрелок» при одновременной стрельбе двух стрелков – совместные события;
событие Е = «выпало 5 очков» и событие М= «выпало 6 очков» при одном подбрасывании игральной кости – несовместные событие.
4) Равновозможные события – события, для которых нет оснований полагать, что одно из них более возможно, чем другое.
Пример: события «на игральной кости выпало число 6» и «на игральной кости выпало число 1» - равновозможные события (исходя из предположения о симметричности кости);
6) Событие А благоприятно событию В, если всегда, когда произойдёт А, произойдёт В. ? Вводят понятие благоприятных исходов опыта!
Пример: событие «выпало 6 очков на игральной кости» благоприятно событию «выпало чётное число очков».
8) Противоположные события - несовместные события, такие, что если одно из них не произошло, то обязательно произойдёт другое. образуют полную группу событий.
Пример: А = «хотя бы один спортсмен команды занял призовое место», тогда
= «ни один спортсмен команды не занял призовое место».
Лингвистическое испытание - это наблюдение (опыт или измерение) за поведением и признаками изучаемых лингвистических объектов. Результатом лингвистического испытания является лингвистическое событие.
Например, испытание состоит в угадывании буквы, стоящей после сочетания «которо..». События, которые могут произойти: А={появилась буква е}, В={ появилась буква г}, С={появилась буква м}, Д={ появилась буква й}. Все данные события являются случайными, элементарными, несовместными, и образуют полную группу. Достоверное событие - появление буквы «о» после сочетания «которог..». Появление любой другой буквы – невозможное событие. Событие А={появилась буква у} и событие={появился пробел} являются противоположными при угадывании буквы после цепочки «котором..».7
- Часть1. Тематический план дисциплины
- Часть 2. Конспекты лекций 8
- Часть 3. Вопросы и задания для практических работ. 79
- Часть 4. Задания для самостоятельной работы 92
- Часть 5. Лабораторные работы 97
- Часть1. Тематический план дисциплины «Основы математической обработки информации»
- Часть 2. Конспекты лекций
- 1.1. Исторические периоды развития математики.
- 1.2. Основы теории множеств
- 1.2.1. Начальные понятия теории множеств.
- 2.1.3. Основные понятия комбинаторики
- 2) Перестановка из n элементов – это размещение из n элементов по n.
- 2.2. Начальные понятия теории вероятностей
- 2.2.2. Определения вероятности событий
- 3.1. Действия над событиями
- 3.2. Вероятность суммы событий
- 3.3. Вероятность произведения событий.
- 3.4. Вычисление вероятности цепочек языковых элементов.
- 3.5. Формула полной вероятности. Формула Байеса.
- 1 H2) Формула полной вероятности.
- 3.6. Теорема Бернулли
- 3.7. Вероятностное моделирование порождения текста.
- 3.8. Предельные теоремы в схеме Бернулли
- 4.1. Случайная величина (св). Начальные понятия.
- 4.2. Функция распределения св (интегральная функция распределения) f(X)
- 4.3. Функция плотности вероятности нсв f(X)
- 4.4. Числовые характеристики св
- 4.5. Законы распределения случайных величин.
- 1) Биномиальный закон распределения.
- 2) Закон Пуассона
- 3) Нормальное распределение (закон Гаусса)
- 6. Вероятность попадания нсв х в заданный промежуток
- 7. Логнормальное распределение
- 5.1. Система двух случайных величин (двумерная св) (1 час)
- 5.1.1. Начальные понятия.
- 5.1.2. Операции над независимыми случайными величинами
- 5.1.3. Числовые характеристики системы двух св
- 5.2. Предельные теоремы теории вероятностей: Закон больших чисел, Центральная предельная теорема и их значение для лингвистического эксперимента.(1 час)
- 5.2.1. Теорема Чебышева для среднего арифметического случайных величин.
- 6.1. Предмет математической статистики. Генеральная и выборочная совокупность.
- 6.2. Статистическое распределение выборки и его графическое изображение
- 6.2.1. Дискретный статистический ряд
- 6.2.2. Интервальный статистический ряд
- 6.3. Числовые характеристики статистического распределения
- Лекция 7. Элементы теории статистических оценок и проверки гипотез.
- 7.1 Статистические оценки параметров распределения и их свойства. Оценка параметров генеральной совокупности по выборке
- 7.1.1. Свойства статистических оценок:
- 7.1.2. Точечные оценки математического ожидания, дисперсии и вероятности.
- 7.1.3. Интервальное оценивание параметров.
- 7.1.4. Доверительные интервалы для параметров нормального распределения
- 7.1.5. Число степеней свободы
- 7.1.7. Определение минимально достаточного объёма выборки в грамматических, фонетико-фонологических и лексикологических исследованиях.
- 7.2. Проверка статистических гипотез. Исследование вероятностных свойств языка и статистики текста с помощью метода гипотез.
- 7.2. Проверка статистических гипотез.
- 7.2.1. Статистические гипотезы.
- 7.2.2. Статистический критерий
- 4.2.3. Принцип проверки статистических гипотез
- 7.2.4. Ошибки при проверке гипотез
- 7.2.5. Проверка лингвистических гипотез с помощью параметрических критериев.
- 7.2.6. Проверка гипотез с помощью непараметрических критериев.
- Часть 3. Вопросы и задания для практических работ.
- I. Элементы комбинаторики.
- Часть 4. Задания для самостоятельной работы
- 1. Графический способ.
- 2. Критерий асимметрии и эксцесса.
- 3. Критерий Колмогорова-Смирнова.
- 4. Критерий Пирсона
- Приложение 1. Значения интегральной функции Лапласа
- Приложение 2. Критические значения ( распределение Пирсона)