Методология извлечения знаний
Одним из аспектов создания базы знаний систем искусственного интеллекта является наполнение ее соответствующим набором знаний. При решении данной проблемы традиционно возникают вопросы, кто и что может быть источником требуемых знаний и какими способами послелние будут извлекаться из этих источников.
Извлечение знаний – это процесс переноса знаний от их источников инженеру по знаниям. Следует заметить, что некоторые специалисты употребляют также термин приобретение знаний. Под этим термином понимают либо процесс передачи знаний эксперта в базу знаний, либо как способ автоматизированного наполнения базы знаний с помощью специальных программ. В том и другом случае за скобками остается участие в данном процессе инженера по знаниям. В то же время именно участие последнего накладывает определенные условия на процесс создания базы знаний.
Сегодня многие специалисты отмечают, что проблема извлечения знаний решена далеко не полностью. На практике разработчикам ЭС приходится самим разрабатывать методы извлечения знаний. К основным трудностям создания баз знаний относят:
-
выбранные методы извлечения могут не совпадать со структурой знаний в предметной области;
-
модель представления знаний неадекватно отражает предметную область;
-
используемые термины имеют различное толкование;
-
не достигается целостность системы знаний вследствие извлечения только фрагментов знаний;
-
неумение наладить контакт с экспертом и упрощение его видения проблемной области;
-
организационные неувязки.
В процессе разработки БЗ инженер по знаниям создает ту модель предметной области, которая будет реализована в системе. Как правило, его модель отличается от модели эксперта. Поэтому основной задачей диалога инженера по знаниям и эксперта является сближение их позиций. Причины, по которым нельзя исключить из процесса разработки системы, понятны.
Как ни странно, при моделировании предметной области эксперту мешает глубина его познаний.
В реальном мире существуют сотни типов отношений между объектами (временные, пространственные, причинно-следственные и др.). Реальная предметная область представляет собой сложную систему. Любая ее модель отражает исследуемую часть реального мира с той или иной степенью точности. В процессе создания модели приходится упрощать имеющие место взаимосвязи между объектами реального мира. Такое упрощение легче сделать аналитику, чем эксперту. Аналитик воспринимает конкретную предметную область в упрощенном виде, он лучше владеет методологией разработки сложных систем. Поэтому-то и включают в коллектив разработчиков систем, основанных на знаниях, как экспертов, так и инженеров по знаниям.
В принципе мышление по своей природе диалогично. Об этом говорили еще древнегреческие исследователи (Платон). Диалогичность мышления подтверждает утверждение, гласящее о том, что в начале было слово.
Инженер по знаниям в диалоге с экспертом выясняет его знания о рассматриваемой предметной области, т.е. сам приобретает необходимые ему знания. В процессе диалога он пытается создать модель предметной области. Если ему не хватает для этого каких-то сведений, он задает вопросы эксперту и заново строит искомую модель. Зачастую эксперт не отдает себе отчета в том, что его рассуждения на самом деле не так просты, как он преподносит их инженеру по знаниям. Он, например, далеко не всегда поясняет, почему одно событие влечет за собой другое. Чтобы выявить причинно-следственные связи между теми или иными явлениями, аналитик вынужден снова обращаться с вопросами к эксперту. Таким образом, процесс построения модели предметной области носит итеративный характер.
Основным источником знаний для инженера по знаниям является эксперт в исследуемой проблемной области. Результативность их взаимодействия существенным образом влияет на качество будущей ЭС.
Известно, что в общении людей психологический аспект является определяющим. Психологическая совместимость разработчиков любого проекта оказывает влияние не только на его качество, а на возможность его реализации. вопросам выявления психологической совместимости людей уделяется большое внимание со стороны психологов. При определении коллектива участников любого проекта несомненно должны учитываться рекомендации психологов.
Эксперт отдает другим разработчикам системы свои знания, накопленные им в течение многих лет трудовой деятельности. Далеко не все специалисты охотно передают свои знания другим. Поэтому первоочередной задачей аналитика выступает создание атмосферы взаимопонимания и взаимопомощи.
Культурой общения обладают далеко не многие. Психологи выделяют четыре уровня общения. На первом уровне одни участники проекта принимают других в качестве средства или помехи при реализации предлагаемых ими вариантов проекта. На втором уровне признаются достоинства других проектов, однако наблюдается стремление навязать свой план. Третий уровень характеризуется признанием права на рассмотрение всех предложенных вариантов и необходимости их согласования. Наконец, четвертый уровень – это уровень нравственного общения, когда все участники проекта принимают общий план взаимной деятельности.
Поскольку извлечение знаний есть особый вид общения, то пренебрежение достижениями в области психологии, приводит к неоправданным потерям информации в процессе передачи знаний от эксперта к аналитику.
Как показывают исследования, потери информации при общении могут достигать значительных размеров. Мицич в своих исследованиях приводит следующие данные [Мицич П.П. Как проводить деловые беседы. М.: Экономика, 1987].
Задумано Приобрело Высказано Выслушано Понято Осталось
словесную в памяти
форму
!00% 90% 80% 70% 60% 24%
Эксперт Общения Инженер по знаниям
В модели общения при извлечении знаний можно выделить следующие компоненты: участники общения, предмет общения и средства общения. В нашем случае предметом общения являются знания, а в качестве средств общения могут выступать время, место проведения сеансов общения, их продолжительность, вспомогательные средства и профессиональные приемы (стиль, методы).
При моделировании процесса общения следует учитывать наличие некоторого языкового барьера между экспертом и инженером по знаниям.
Язык эксперта помимо обычного языка включает общенаучные и специальные термины, а также неологизмы. Последние, вообще говоря, представляют собой некоторый жаргон.
Язык инженера по знаниям беднее языка эксперта в компоненте общенаучной и, особенно, специальной терминологии.
Для повышения результативности общения аналитику и эксперту необходимо какой-то общепринятый язык общения, или, как говорят специалисты, общий код. Если аналитик не усвоит языка предметной области, то вряд ли он построит ее адекватную модель. Особенно опасна разная интерпретация одних и тех же терминов.
Проблема интерпретации рассматривается в науке о знаковых системах, семиотики. Считается, что первым исследователем проблемы символов в науке был Лейбниц,а имя семиотика было позднее предложено Г. Ламбертом.
К числу важных проблем общения в среде разработчиков любой системы относится и формирование структуры понятий исследуемой предметной области.
Установлено, что в памяти человека отдельные понятия объединяются во фрагменты, фрагменты – в сценарии и.т.д. Можно сказать, что все понятия образуют некоторую семантическую сеть. Отсюда следует, что аналитик должен объединить полученные знания в единое целое прежде, чем приступать к построению модели рассматриваемой предметной области. Целостность восприятия, как подчеркивают психологи, служит основой мышления человека. Она помогает получить глубинные знания о предметной области, которыми владеет эксперт.
В задачу инженера по знаниям входит выявление хода рассуждений эксперта. У эксперта между всеми понятиями установлены взаимосвязи, он видит закономерности, присущие проблемной области. Одни закономерности носят явный характер, другие – не явный. Некоторые закономерности могут устанавливаться экспертом в ходе его рассуждений. Чтобы лучше воспользоваться знаниями эксперта, аналитику требуется овладеть логикой научных исследований. Усвоение основных принципиальных положений методологии проведения исследований помогает ему увидеть общую картину изучаемой проблемной области.
Здесь полезно иметь ввиду, что теория извлечения знаний является разделом общей теории познания. В теории познания исследуются законы отражения действительности в сознании человека. Методология извлечения знаний основана на основных положениях этой теории. Согласно теории познания все знания можно разделить на два вида: эмпирические и теоретические. К первым относятся результаты всякого рода наблюдений, ко второму – абстракции, обобщения, установленные законы.
Эмпирическому знанию свойственно модальность, противоречивость и неполнота. Модальность означает, что знания могут принимать характер существования и долженствования.
Теоретические знания характеризуются системностью, объективностью и историчностью.
Процесс познания содержит следующие этапы:
-
наблюдения;
-
описание наблюдений (описание и обобщение фактов);
-
установление логических связей и законов;
-
построение идеализированной модели;
-
объяснение и предсказание явлений.
Методология создания баз знаний учитывает структуру процесса познания реального мира, т.е. его отображения в сознании человека.
Лекция 18
Yandex.RTB R-A-252273-3- Компонент приобретения знаний
- Механизм получения решений
- Класификация эс и инструментальные средства их создания
- Теоретические основы экспертных систем
- Организация знаний в эс
- Формальные языки
- Алгебра высказываний
- Алгебра предикатов
- Семантические сети
- Объекто ориентированная модель данных.
- Основы нечеткой логики
- Задача достижения нечетко определенной цели
- Методология извлечения знаний
- Инженерия знаний