Правила "буква-звук" и лексическое ударение
В системе MITalk нормализованный вводный текст подвергается морфологическому анализу. Может быть, что целое слово есть в словаре морфов, как, например, слово "snow". С другой стороны, слово может быть проанализировано как последовательность соединенных морфов. В английском языке среднее число морфов в слове — примерно два. В случае, если целое слово не может быть ни найдено в словаре морфов, ни проанализировано как последовательность морфов, применяются правила преобразования "буква-звук". Важно подчеркнуть, что этот метод никогда не применяется, если морфемный анализ удался. Конвертация последовательности букв в последовательность звуков при помощи этих правил проходит в три этапа. Первый этап — отделение префиксов и суффиксов. Возможность отделения аффиксов не такая сильная, как в морфемном анализе, но действует удовлетворительно. Предполагается, что после отделения префиксов и суффиксов остается одна центральная часть слова, которая состоит из одного морфа, подвергаемого затем правилам преобразования.
Второй этап состоит в преобразовании согласных в фонетические значки, начиная с наиболее длинного согласного кластера до тех пор, пока все отдельные согласные не будут преобразованы. Последний этап — оставшиеся гласные преобразуются при помощи контекстов. Гласные преобразуются последними, потому что это наиболее трудная задача, зависящая от контекста. Например, гласный кластер /ea/ имеет 14 разных произносительных контекстов и несколько произношений (reach, tear, steak, leather).
В системе MITalk правила преобразования букв в звуки действуют в паре с широким набором правил расстановки лексического ударения. Еще 25 лет назад лингвистам не удавалось обнаружить никакой системы расстановки ударений в английских словах. В настоящее время разработан ряд правил, эффективно справляющихся с этой задачей. Ударения зависят от синтаксической роли слова, например, прилагательное "invalid" отличается от существительного. Таких слов немного, но учитывать их необходимо. Кроме того, на некоторые суффиксы автоматически падают ударения в словах, как, например, в "engineer". Но бывают более сложные случаи, которые разрешаются применением циклических правил. В системе MITalk разработаны несколько наборов таких правил, некоторые из которых включают в себя до 600 правил. Конечно, большинство из них употребляются довольно редко. Подразумевается, что все сильные и неправильные формы преобразуются на стадии морфологического анализа. Правила же "буква-звук" используются для пр еобразования новых и неправильно написанных слов. Например, слово "recieved" получает правильную транскрипцию, благодаря этим правилам преобразования.
- Лекция 1 Цель преподавания дисциплины
- Терминология
- Философские аспекты проблемы систем ии (возможность существования, безопасность, полезность).
- История развития систем ии.
- Лекция 2 Различные подходы к построению систем ии
- Вспомогательные системы нижнего уровня (распознавание образов зрительных и звуковых, идентификация, моделирование, жесткое программирование) и их место в системах ии
- Лекция 3 Понятие образа
- Проблема обучения распознаванию образов (оро)
- Геометрический и структурный подходы.
- Гипотеза компактности
- Обучение и самообучение
- Лекция 4: Адаптация и обучение
- Персептроны
- Нейронные сети История исследований в области нейронных сетей
- Модель нейронной сети с обратным распространением ошибки (back propagation)
- Нейронные сети: обучение без учителя
- Нейронные сети Хопфилда и Хэмминга
- Метод потенциальных функций
- Метод группового учета аргументов мгуа Метод наименьших квадратов
- Общая схема построения алгоритмов метода группового учета аргументов (мгуа)
- Алгоритм с ковариациями и с квадратичными описаниями
- Метод предельных упрощений (мпу)
- Коллективы решающих правил
- Лекция 5: Методы и алгоритмы анализа структуры многомерных данных
- Иерархический кластерный анализ
- Стандартизация
- Быстрый кластерный анализ
- Кластерный анализ
- Иерархическое группирование
- Лекция 6: Логический подход к построению систем ии Неформальные процедуры
- Алгоритмические модели
- Продукционные модели
- Режим возвратов
- Логический вывод
- Зависимость продукций
- Продукционные системы с исключениями
- Язык Рефал
- Лекция 7: Экспертные системы Экспертные системы, базовые понятия
- Экспертные системы, методика построения
- Этап идентификации
- Этап концептуализации
- Этап формализации
- Этап выполнения
- Этап тестирования
- Этап опытной эксплуатации
- Экспертные системы, параллельные и последовательные решения
- Пример эс, основанной на правилах логического вывода и действующую в обратном порядке
- Часть 1.
- Лекция 8: Машинная эволюция Метод перебора как наиболее универсальный метод поиска решений. Методы ускорения перебора
- Эволюция
- Генетический алгоритм (га)
- Как создать хромосомы?
- Как работает генетический алгоритм?
- Эволюционное (генетическое) программирование
- Автоматический синтез технических решений
- Поиск оптимальных структур
- Алгоритм поиска глобального экстремума
- Алгоритм конкурирующих точек
- Алгоритм случайного поиска в подпространствах
- Некоторые замечания относительно использования га
- Лекция 9. Автоматизированный синтез физических принципов действия. Синтез речи Фонд физико-технических эффектов
- Синтез физических принципов действия по заданной физической операции
- Заключительные замечания
- Слабосвязанный мир
- Разделяй и властвуй
- Синтез речи
- Голосовой аппарат человека
- Структура языка
- Технология
- Методы синтеза
- Волновой метод кодирования
- Параметрическое представление
- Синтез по правилам
- Конвертация текста в речь
- Система преобразования текста в речь miTalk
- Анализ текста
- Морфологический анализ
- Правила "буква-звук" и лексическое ударение
- Парсинг
- Модификация ударения и фонологические уточнения
- Просодическая рамка
- Синтез фонетических сегментов
- Оценка синтетической речи