logo search
1

4.2. Инженерно-психологические вопросы организации диалога “человек – эвм”

До настоящего времени еще нет достаточно полной ясности в вопросе о том, какой вид общения может быть назван диалогом и как выявить его наиболее существенные параметры. Правда, следует сказать, что наблюдавшиеся в течение значительного времени недостаток систематизированных представлений о человеко-машинном диалоге, расплывчатость и неопределенность основных понятий, явившиеся следствием недооценки человеческого фактора, постепенно преодолеваются. Это создает предпосылки для эффективного использования психологических знаний и методов при разработке диалога человека с ЭВМ.

Понятие диалога человека с ЭВМ можно ограничить таким взаимодействием, которое носит характер перемежающегося обмена запросно-ответными репликами с интервалами между ними, не превышающими субъективно ожидаемого, при непременном условии неполноты имеющейся в распоряжении каждого партнера информации. Для совершенствования процесса общения нужно понимать, почему люди общаются так, а не иначе, т. е., для того чтобы выявить специфику общения человека с ЭВМ, необходимо сравнить это общение с коммуникацией между людьми при решении конкретных задач.

К настоящему времени выполнены некоторые инженерно-психологические исследования способов организации процедуры общения в процессе диалога. Отправным моментом этих исследований как раз и послужило положение, что значительный прогресс в организации общения человека с ЭВМ может быть достигнут в результате понимания процесса общения человека с человеком, в частности факторов, влияющих на естественную коммуникацию, например, устройств связи человека с ЭВМ. Именно отсутствием информации по этим вопросам можно объяснить тот факт, что на передний план при организации такого взаимодействия до последнего времени выдвигали технические и экономические критерии и оставляли в тени инженерно-психологические критерии. Результаты проведенных исследований со всей очевидностью продемонстрировали громадную важность инженерно-психологического анализа даже отдельных аспектов проблемы общения человека с ЭВМ.

Необходимым условием при организации эффективного диалога выступает постулат о знании пользователем “языка общения” с машиной. Поэтому эффективность будущих систем “человек – ЭВМ” будет существенно зависеть от того, насколько согласованно будут развиваться входные языки программирования (общения) и внутренние языки вычислительной машины. Таким образом, обеспечение языковой совместимости пользователя и машины становится важным аспектом проектирования систем “человек – ЭВМ”. Поэтому в последние годы деятельность многих ученых направлена на создание таких языков, которые требовали бы возможно меньших усилий для их усвоения разными категориями пользователей.

Поиски в этом направлении связаны с разработкой такого входного языка программирования, который был бы в достаточной степени близок к логико-математическому диалекту естественного языка, обеспечивал бы широкие возможности для творческой деятельности пользователя, включал бы в себя программные средства диалога и в то же время не создавал бы чрезмерных сложностей в интерпретации языка. При этом следует исходить из положения, что, по-видимому, не может существовать один-единственный язык, полезный любому пользователю в системе “человек – ЭВМ”. Следовательно, в последней должен функционировать ряд языков. По-видимому, требует приближения к естественному языку в первую очередь язык передачи сообщений от машины к человеку. В то же время язык постановки задач для ЭВМ должен быть проблемно ориентированным языком высокого уровня.

Чтобы человек мог вступить в непосредственное взаимодействие с ЭВМ в режиме диалога до того момента, когда ЭВМ будут обладать способностью обработки сообщений на естественном языке, разрабатываются специальные программные языки, которые представляют упрощенные варианты естественного языка. В диалоговых системах и в системах типа “вопрос – ответ” такие языки обычно называют “языками запроса”. Основное требование к такому языку: сообщения на нем должны восприниматься пользователем при минимальном объеме специальной подготовки. Для составления сообщений на языке запроса также необходима некоторая подготовка, но значительно меньшая по сравнению с изучением обычных машинных языков.

Конечно, язык запроса не может быть использован для формирования неограниченного числа сообщений. Он скорее относится к специальным областям взаимодействия, связанным с конкретными задачами (экономическими, диспетчерскими и т. д.), в которых стереотипные сообщения с жесткой конструкцией могли бы использоваться с наибольшей полнотой.

Стремление ученых приблизить языки общения к естественным языкам требует лингвистического (семантического и синтаксического) анализа и синтеза. При этом языковые, лингвистические аспекты диалога нельзя выделять из общего контекста его психологического изучения. Это становится особенно очевидным, если представить язык диалога через понятия директивы, в которой содержится подинформация, управляющая работой системы, и информативы, в которой содержатся, в частности, ответы системы на указания пользователя. Отсюда вытекает, что необходимы самые серьезные исследования по формированию и реализации специальных языков изображений, представляемых обычно в виде кодов “графического языка”, которые бы избавили пользователя от трудоемких операций кодирования и перекодирования сообщений. Важность таких исследований для повышения эффективности взаимодействия подтверждается все увеличивающимся числом данных. Так, например, в результате специальных исследований были разработаны требования к построению кодов, ориентированных на пользователя. Разработка этих требований осуществлялась на основе анализа различных функций, выполняемых человеком в АСУ, мотивов его деятельности и критериев ее оценки, а также с учетом квалификации пользователя, длины, алфавита кода, структуры сообщения и т. д.

Наиболее распространенным классом диалоговых систем в настоящее время являются визуальные диалоговые системы (ВДС) – системы, в которых используется визуальная форма представления информации человеку в процессе диалога. Инженерно-психологический анализ и оценку разрабатываемых ВДС следует производить на нескольких уровнях проектирования: проблемно - функциональном, процедурном, операционном.

Проблемно-функциональным уровнем проектирования называется уровень инженерно-психологического проектирования, на котором формулируются задачи и цели, реализуемые человеком в процессе диалога, и распределяются функции между партнерами диалоговой системы.

Процедурным уровнем является уровень инженерно-психологического проектирования, на котором разрабатываются конкретные процедуры взаимодействия операторов с терминальным оборудованием системы – видеотерминалом, абонентским пультом и т.п. Именно здесь необходимо выбрать последовательность обмена репликами и процедурную структуру диалога в целом, разработать его “сценарий” и “действия”, определить семантику и синтаксис реплик. Исходя из наиболее типичной для данного класса задач длины сообщения и его формата, следует определить требуемую информационную емкость экрана видеотерминала (или других индикационных средств) и формат расположения информации на экране, длину строк и их количество и т. п.

Процедурная структура диалога в сильной степени зависит от взаимодействия пользователя с ЭВМ. Исследования показывают, что пользователи-непрофессионалы, осуществляющие разовое или эпизодическое взаимодействие, направленное главным образом на удовлетворение информационной потребности, более эффективно реализуют процедуры типа “меню” и “дихотомический вопрос”, в которых типичная реплика состоит из предельно малого (1-3) числа символов (что является важным фактором снижения количества ошибок ввода информации, обычно характерных для этих категорий операторов). Вообще, хотя сейчас большинство мер против ошибок, вносимых пользователем, принимается на операционном уровне проектирования ВДС, многие причины ошибок пользователя являются следствием недостаточной психологической проработки диалоговых процедур и должны устраняться на процедурном уровне проектирования.

Диалог как вид речи характеризуется высокой контекстуальностью, в силу чего каждая реплика пользователя обусловлена не только очередной репликой системы, но и предыдущими сообщениями. Здесь имеет место отличие семантической структуры диалога от его ритмической структуры, в которой длительность каждой реплики зависит, по некоторым данным, только от длительности предыдущей реплики. Следует также указать, что вопрос о допустимой информационной насыщенности системных реплик тесно связан с возможностями кратковременной памяти человека. Поэтому перегрузка оператора информацией не только затрудняет ее восприятие и оценку на данном шаге диалога, но и снижает эффективность использования предшествующей информации при последующем развитии диалога.

Операционный уровень инженерно-психологического проектирования – это уровень, предусматривающий оптимизацию основных перцептивных и моторных компонентов деятельности оператора в рамках общей структуры деятельности, сформированной на проблемно-функциональном и процедурном уровнях проектирования. В основном это относится к визуальному восприятию информации оператором и к различным манипуляциям, осуществляемым оператором над информацией с помощью средств взаимодействия, таких как клавиатура, трекболл и др. Иными словами, на данном уровне должны определяться инженерно-психологические требования к терминальному (оконечному) оборудованию системы. Из всей проблематики психологического изучения диалоговых систем наибольшее число экспериментальных результатов относится именно к этому кругу вопросов.

Укажем еще на два важных аспекта создания эффективных систем “человек – ЭВМ”. Первый связан с использованием для общения человека с ЭВМ одного из естественных способов коммуникации людей: непосредственного речевого общения. В рамках этого аспекта можно выделить такие вопросы, как синтез речи, автоматическое распознавание речи, понимание “машинной” речи, практическое осуществление речевой коммуникации и т. п.

Вывод речевой информации в значительной степени позволяет разгрузить зрительный канал. В качестве примера можно сослаться на создание системы управления и контроля энергоблоком, при которой с визуального канала было снято, а на слуховой перенесено около 30% всей информации. Принятая структура позволяла синтезировать сообщения из слов, а не морфем (морфема – минимальная значимая часть слова). Для синтеза речи использовался магнитный барабан с аналоговой записью на 40-45 дорожках.

Предложена также система анализа речи, основанная на измерениях временных параметров волн. Этот метод анализа может рассматриваться как альтернатива наиболее общему методу исследования акустической структуры речи, основанному на анализе частот.

Специальные исследования ввода речи показывают, что при автоматическом распознавании речи существенные трудности возникают при переходе от отдельных слов к непрерывной речи, где в противоположность читаемому материалу границы слов не определены. Но, с другой стороны, проговариваемый материал содержит некоторые слоги или слова, которые имеют большую “важность”, более нагружены, чем другие. Тогда проблема заключается в том, чтобы обнаружить объективные корреляты важности и определить, где эти корреляты могут быть использованы для фиксации границы фразы или слова и для выделения более “нагруженных” слов.

Таким образом, при синтезе речи необходимо знать основные правила определения “нагруженности” в естественной речи и учитывать их влияние на фундаментальную частоту употребления предложения. Есть основания полагать, что ввод будет зависеть и от индивидуальных качеств оператора. Критичными по отношению к гибкому автоматическому распознаванию речи, особенно для каждого случая опознавания естественной речи различных дикторов, являются вопросы артикуляционной фонетики. Однако, если даже будет реализовано полное фонетическое распознавание, значительные трудности, связанные с переходом от фонетических к лексическим ограничениям, все равно сохранятся.

Несмотря на ряд очевидных практических результатов, полученных при исследовании речевого взаимодействия, речевой ввод в настоящее время все еще является предметом экспериментальных лабораторных исследований с очень ограниченными практическими выходами. Это объясняется не только относительно высокой стоимостью оборудования для реализации речевого ввода, но и недоработанностью целого ряда важных (для этой цели) теоретических вопросов. Отсутствие теоретических проработок приводит к тому, что исследования в области организации речевого взаимодействия человека с ЭВМ продвигаются очень медленно. В то же время вообще ставится под сомнение их целесообразность.

Имеются также данные, что режим взаимодействия пользователя с машиной на вербальном уровне наиболее благоприятен для рутинной работы, для проверки обдуманных и легко понимаемых идей и тактического решения задач. Однако более сложные “стратегические” решения могут потребовать другой организации взаимодействия. Таким образом, вопрос о том, необходим ли речевой уровень общения с ЭВМ, не может быть решен без проведения соответствующих экспериментальных исследований.

Основная трудность на пути прогресса в автоматическом распознавании речи связана с необходимостью автоматизации двух главнейших способностей человека – слухового восприятия речи и понимания смысла. Уровень наших знаний пока не позволяет с достаточной степенью универсальности определить машинные процедуры, способные дублировать поразительные способности человека. На всех уровнях речевого ввода существует много нерешенных проблем. В частности, возникает вопрос, какие приемлемые характеристики речи могут быть взяты за основу. Обычно для характеристики речи используются данные, показывающие распределение энергии сигнала по различным частотам в зависимости от времени. Однако этот подход, как правило, ориентирован на конкретного диктора, и может использоваться для очень ограниченного числа команд голосом. Правда, предложен способ, позволяющий расширить рамки применимости обсуждаемого метода. Смысл его состоит в разработке средств для быстрой смены “шаблонов” применительно к новому диктору. Однако сегментация речи существенно ограничивает эффективность этого устройства. Так, для отдельных испытуемых удалось получить достаточно высокий уровень точности (89 -96%) при словаре, состоящем всего лишь из 20 слов.

Второй аспект исследования касается теоретико-познавательного анализа интегрального человеко-машинного интеллекта и связанных с ним проблем развития как человеческого мышления, так и машинного (искусственного) интеллекта. Работы этого направления выходят за рамки собственно инженерно-психологических исследований, но тем не менее тесно связаны с ними, и в ряде случаев могут влиять на постановку их и решение. Эта связанность проявляется в нескольких направлениях. Теоретические работы по искусственному интеллекту неотделимы от исследований процессов принятия решений оператором и в этом отношении непосредственно затрагивают целый ряд инженерно-психологических вопросов, связанных с созданием АСУ.

Технический прогресс привел к созданию человеко-технических систем, включающих искусственный интеллект, например, систем космического назначения и систем для глубоководных исследований. Включение в состав этих систем искусственного интеллекта оказывает значительное влияние на все фазы проектирования деятельности, изменяя не только позицию человека в системе, но и его функции, и даже сказывается на организации сопряжения оператора с аппаратурой. Наконец, проблема искусственного интеллекта теснейшим образом связана с проблемой организации взаимодействия человека и ЭВМ, так как, по справедливому замечанию Г. Л. Смоляна, высший уровень машинного интеллекта, по-видимому, может быть достигнут на основе взаимодействия с человеческим интеллектом путем создания человеко-машинных систем.