1.2.1. Начальные понятия теории множеств.
1) Множества обозначаются прописными буквами, а элементы множества - строчными буквами латинского алфавита: А={a1;a2;…;an…}, где a1;a2;…;an…- элементы множества.
Например, буква Ф является элементом множества букв русского алфавита (принадлежит), а буква F- не является (не принадлежит) этому множеству.
Множество лингвистических объектов:
- множество букв в русском алфавите (или в алфавите любого другого языка);
- множество словоупотреблений (цепочка букв, заключённая между двумя пробелами) в тексте,
- множество словоформ (полностью совпадающие словоупотребления образуют одну словоформу);
- множество слов (класс семантически и грамматически связанных между собой словоформ);
- множество фонем (минимальная языковая единица, обладающая смыслоразличительной функцией);
- множество морфем (значимая часть слова естественного языка).
2) Способы задания: перечисление элементов, описание свойств.
Например: М={1,2,3} или М={x|
3).Пустое множество Ø не имеет ни одного элемента.
Пустое лингвистическое множество: множество двухбуквенных комбинаций чы, бй, оъ в русских текстах; множество дифтонгов в русском языке.
4) Равные множества состоят из одних и тех же элементов или оба пустые.
Например: а) если К={А, В, Б} и D ={ А, Б, В }, то К= D;
б) множество А={вы, вас, вам, вами} равно множеству, включающему формы склонения местоимения «вы».
5) Для наглядности множества изображаются с помощью кругов или других геометрических фигур (круги Эйлера и диаграммы Венна)
6 В
е А
Обозначение: .
Само множество является своим подмножеством: .
Пустое множество является подмножеством любого множества: ØВ;
Например, множество М={1,2,3} является подмножеством множества натуральных чисел N: ; множество огубленных гласных звуков [о] и [и] является подмножеством множества гласных звуков.
7) Булеан множества – множество всех его подмножеств. Обозначается: β(А).
Например: если А={f, p, q}, тогда β(А)={Ø, {f}, {p}, {q}, {f;p}, {f;q},{p;q},{f;p;q}}.
8) Числовые множества:
- C
N Q Q R
-множество целых чисел, обозначаетсяZ,
Z N
-
множество дробей вида
- множество действительных чисел, обозначается R, множество всех чисел, которые можно изобразить точкой числовой прямой
- множество комплексных чисел, обозначается C, множество всех чисел, которые можно изобразить точкой комплексной плоскости.
9) Эквивалентные множества – множества, между элементами которых можно установить взаимно однозначное соответствие.
10) Мощность множества – количество его элементов. Обозначается:.
Например: если В={а,в,1,2}, то =4;
Мощность множества букв русского алфавита равна 33;
мощность множества неслоговых фонем в русском языке равна1 (и), мощность множества падежей в русском языке – 6,
множество косвенных падежей имеет мощность равную 5 (все, кроме именительного).
11) Различают конечные и бесконечные множества. Бесконечные множества по мощности можно разделить на счётные и несчётные множества.
Схема1
Счётное множество – это бесконечное множество, эквивалентное множеству натуральных чисел (элементы которого можно занумеровать, т.е. каждому элементу поставить в соответствие натуральное число).
Пример: множество чётных натуральных чисел, множество целых чисел, кратных 5 и т.д.
Некоторые из несчётных множеств являются множествами мощности континуум – бесконечные множества, эквивалентные множеству действительных чисел (неисчерпаемые, непрерывные).
Например: Е=[-3;5); F=[0;1] - множества мощности континуум
Лингвистика чаще имеет дело с конечными множествами, например: множество глаголов в отрывке текста; множество слов в предложении; множество букв в алфавите определённого языка; множество произведений данного автора и т.п.
Примером бесконечного лингвистического множества может быть множество всех словоупотреблений в текстах данного языка при условии, что этот язык беспрерывно порождает и будет порождать новые тексты без какого либо ограничения во времени.
1.2.2. Операции над множествами
1 В А
включает элементы, принадлежащие хотя бы одному
из множеств А и В
2. Пересечение множеств А и В,
о В А
множеств А и В.
3 А В
включает элементы, принадлежащие множеству А,
не входящие в В.
4 А В
обозначается АΔВ, включает элементы,
п U
5 А
(U- универсальное множество), включает
элементы, принадлежащие множеству U, но не входящие в А.
Примеры. 1) А={1;2;3;4}; B={2;4;6}
={1;2;3;4;6}; ={2;4}; ={1;3}; ={6};
АΔВ={1;3;6}; ={x|
2. Операции над множествами можно проиллюстрировать с помощью множеств губных казахских согласных А = {b,p,m,w} и сонорных казахских согласных В = {m,n,n’,w,l,r,j}:
={b,p,m,n,n’,w,l,r,j}; ={m,w};
= {b,p}; = {n,n’,l,r,j}; АΔВ={b,p,n,n’,l,r,j}.
1.2.3. Отношения на множествах
Отношение – любая зависимость между элементами одного или нескольких множеств
1) Виды отношений на множествах
- унарные (1-местные), например, R={быть гласной буквой} на множестве букв алфавита естественного языка;
- бинарные (2-местные), например: R={содержать одинаковое количество букв} на множестве слов естественного языка;
- тернарные (3 –местные), например, зависимость между компонентами арифметических действий: делимое, делитель, частное;
- n – местные.
2) Свойства бинарных отношений на множестве А
Рефлексивность
Антирефлексивность
Симметричность
Антисимметричность
Транзитивность
3) Типы бинарных отношений
Эквивалентность – обладает свойствами рефлексивности, симметричности, транзитивности. Разбивает универсальное множество на непересекающиеся подмножества – классы эквивалентности.
Отношение порядка упорядочивает элементы множества, задаёт иерархию на множестве
Отношение нестрогого порядка обладает свойствами антирефлексивности, антисимметричности, транзитивности;
Отношение строгого порядка обладает свойствами рефлексивности, антисимметричности, транзитивности.
Отношения толерантности обладает свойствами рефлексивности, симметричности.
Примеры:2
1.Отношение R1={быть родственными языками} на множестве языков мира является отношением эквивалентности, т.к. обладает свойствами рефлексивности, симметричности, транзитивности. Это отношение делит универсальное множество – множество языков мира – на группы родственных языков.
2. Отношение R2 ={быть предком} на множестве языков мира является отношением строгого порядка, так как обладает свойствами антирефлексивности, антисимметричности и транзитивности.
3. Отношение R3 ={содержать одинаковые слова} на множестве предложений является отношением толерантности, так как обладает свойствами рефлексивности и симметричности, но не является транзитивным.
4. Отношение порядка R= « иметь более высокий частотный ранг» на множестве слов определённого языка задействовано при создании частотных словарей. Это отношение является отношением строгого порядка, так как обладает свойствами антирефлексивности, антисимметричности и транзитивности.
5) Отношение «непосредственного заимствования» (язык Х заимствует из языка У) на множестве языков одной группы, обладает свойствами антирефлексивности, антисимметричности, и не является транзитивным.
Лекция 2. Комбинаторика. Начальные понятия теории вероятностей
Комбинаторика – раздел математики, в котором изучаются вопросы о том, сколько различных комбинаций, подчинённых тем или иным условиям, можно составить из заданных объектов.
«Языковеду постоянно приходится решать задачи, в которых рассматриваются комбинации и расположения элементов, принадлежащих определённому лингвистическому множеству. Так, например, синтаксисту важно знать, сколько позиционных вариантов может давать в устно-разговорной речи предложение «Сегодня идёт дождь». Фонетисту, специалисту в области кодирования текста, а также работнику ГИБДД, занимающемуся распределением букв серий автомобильных знаков на территории страны, нужно знать сколько, двух- и трёхбуквенных комбинаций может дать русский алфавит»3.
2.1.1. Правила комбинаторики
Пусть элемент можно выбратьспособами;–способами;…,–способами.
Тогда:
1) элемент
можно выбрать способами;
2) элемент
можно выбрать способами .
2,2. n! (n-факториал) – произведение n первых натуральных чисел.
1! =1; 2!=12=2; 3!= 123=6; 4!= 1234=24; …..
n!= 123…n (при n>3) 0!=1
- Часть1. Тематический план дисциплины
- Часть 2. Конспекты лекций 8
- Часть 3. Вопросы и задания для практических работ. 79
- Часть 4. Задания для самостоятельной работы 92
- Часть 5. Лабораторные работы 97
- Часть1. Тематический план дисциплины «Основы математической обработки информации»
- Часть 2. Конспекты лекций
- 1.1. Исторические периоды развития математики.
- 1.2. Основы теории множеств
- 1.2.1. Начальные понятия теории множеств.
- 2.1.3. Основные понятия комбинаторики
- 2) Перестановка из n элементов – это размещение из n элементов по n.
- 2.2. Начальные понятия теории вероятностей
- 2.2.2. Определения вероятности событий
- 3.1. Действия над событиями
- 3.2. Вероятность суммы событий
- 3.3. Вероятность произведения событий.
- 3.4. Вычисление вероятности цепочек языковых элементов.
- 3.5. Формула полной вероятности. Формула Байеса.
- 1 H2) Формула полной вероятности.
- 3.6. Теорема Бернулли
- 3.7. Вероятностное моделирование порождения текста.
- 3.8. Предельные теоремы в схеме Бернулли
- 4.1. Случайная величина (св). Начальные понятия.
- 4.2. Функция распределения св (интегральная функция распределения) f(X)
- 4.3. Функция плотности вероятности нсв f(X)
- 4.4. Числовые характеристики св
- 4.5. Законы распределения случайных величин.
- 1) Биномиальный закон распределения.
- 2) Закон Пуассона
- 3) Нормальное распределение (закон Гаусса)
- 6. Вероятность попадания нсв х в заданный промежуток
- 7. Логнормальное распределение
- 5.1. Система двух случайных величин (двумерная св) (1 час)
- 5.1.1. Начальные понятия.
- 5.1.2. Операции над независимыми случайными величинами
- 5.1.3. Числовые характеристики системы двух св
- 5.2. Предельные теоремы теории вероятностей: Закон больших чисел, Центральная предельная теорема и их значение для лингвистического эксперимента.(1 час)
- 5.2.1. Теорема Чебышева для среднего арифметического случайных величин.
- 6.1. Предмет математической статистики. Генеральная и выборочная совокупность.
- 6.2. Статистическое распределение выборки и его графическое изображение
- 6.2.1. Дискретный статистический ряд
- 6.2.2. Интервальный статистический ряд
- 6.3. Числовые характеристики статистического распределения
- Лекция 7. Элементы теории статистических оценок и проверки гипотез.
- 7.1 Статистические оценки параметров распределения и их свойства. Оценка параметров генеральной совокупности по выборке
- 7.1.1. Свойства статистических оценок:
- 7.1.2. Точечные оценки математического ожидания, дисперсии и вероятности.
- 7.1.3. Интервальное оценивание параметров.
- 7.1.4. Доверительные интервалы для параметров нормального распределения
- 7.1.5. Число степеней свободы
- 7.1.7. Определение минимально достаточного объёма выборки в грамматических, фонетико-фонологических и лексикологических исследованиях.
- 7.2. Проверка статистических гипотез. Исследование вероятностных свойств языка и статистики текста с помощью метода гипотез.
- 7.2. Проверка статистических гипотез.
- 7.2.1. Статистические гипотезы.
- 7.2.2. Статистический критерий
- 4.2.3. Принцип проверки статистических гипотез
- 7.2.4. Ошибки при проверке гипотез
- 7.2.5. Проверка лингвистических гипотез с помощью параметрических критериев.
- 7.2.6. Проверка гипотез с помощью непараметрических критериев.
- Часть 3. Вопросы и задания для практических работ.
- I. Элементы комбинаторики.
- Часть 4. Задания для самостоятельной работы
- 1. Графический способ.
- 2. Критерий асимметрии и эксцесса.
- 3. Критерий Колмогорова-Смирнова.
- 4. Критерий Пирсона
- Приложение 1. Значения интегральной функции Лапласа
- Приложение 2. Критические значения ( распределение Пирсона)