Модели, основанные на когнитивном подходе (с учетом процессов восприятия, памяти, мышления, психологических особенностей пользователя)

Это модели, отражающие механизмы понимания, формирования и функционирования структуры знаний, мотиваций, процессов переработки информации пользователем в процессе взаимодействия с интерфейсом. Различают эти модели по степени адекватности представления компетенции (уровня знаний) и деятельности пользователя.

Модели компетенции предназначены для описания правильной последовательности поведения, но обычно без рассмотрения реального поведения пользователей, это так называемые нормативные модели. Противоположны им модели деятельности, которые описывают не только правильную последовательность действий пользователя, но также и необходимые для этого знания и то, как эти знания реально используются при выполнении конкретных задач. Модели компетенции, следовательно, представляют ожидаемое поведение пользователя, но они малополезны для представления реального поведения пользователя. Модели же деятельности сосредоточены на реальном поведении, но в ограниченном круге приложений. Другим отличием моделей компетенции от моделей деятельности является то, что первые основаны на сборе информации и составлении планов действий, а вторые — на выполнении планов и действий. Когнитивные модели представлены обычно тремя разновидностями:

  • 1) иерархической структурой задач и целей пользователя;
  • 2) лингвистико-грамматическими моделями;
  • 3) физическими моделями (в основном исполнительных действий на уровне «человек — пульт управления»).

Первая разновидность имеет дело с четкой структурой (как правило, иерархической), отражающей взаимосвязь целей и задач. Вторая разновидность предполагает представление целей, задач и вообще всех действий на языке пользователей, т.е. на обычном языке, но этот язык должен быть предельно понятен для пользователей. Третья разновидность делает упор на исполнительском, моторном уровне, жертвуя уровнем понимания (т.е. делай так, потом так).

Когнитивные модели, иными словами, оперируют четырьмя основными категориями субъективной структуры знаний пользователя: пониманием, знанием, намерениями, способом преобразования информации.

3.4.1. Иерархическая структура задач и целей пользователя

Многие модели пользователей основаны на представлении о психи ческих процессах как об иерархической структуре, на верхнем уровне которой находятся основные задачи, которые надо решить, на нижележащем уровне — их разбиение на подзадачи, на следующем нижележащем уровне — разбиение уже этих подзадач на подзадачи более мелкие и т.д. до следующего уровня, который представлен обычно простыми исполнительскими действиями. При этом каждой подзадаче соответствуют процедуры ее решения и другие факторы, учет которых необходим для решения. Такого рода разбиения имеют место и в ряде других моделей, но здесь эта черта является главной. Основные аспекты иерархической декомпозиции задач следующие:

  • • степень детализации:
    • — где мы начнем;
    • — где мы закончим;
  • • обычные приемы при изучении поведенческих аспектов (а не решения проблем):
  • — задача выделенного блока (модуля) поведения;
  • • конфликт:
    • — более одного пути достижения цели;
  • • ошибки.

Выделяют следующие технологии декомпозиции:

  • • метод GOMS;
  • • теорию когнитивной сложности (ССТ);
  • • иерархический анализ задач.

Наиболее распространенным вариантом реализации этих моделей являются модели, объединенные аббревиатурой GOMS (Goals, Operators, Methods, Selections — цели, операторы, методы, правила их выбора), и модели когнитивной сложности, обозначаемые обычно как ССТ (Cognitive Complexity Theory).

Составляющие модели GOMS следующие.

Цели — это то, что пользователь хочет достигнуть. Причем они должны быть такими, которыми действительно оперирует пользователь, т.е. адекватно отражать субъективное разбиение им цели на подцели разного уровня.

Операторы — это самый нижний уровень анализа. Он предполагает действия, которые надо произвести для выполнения задачи. Например, нажать клавишу такую-то или совершать какие-то внутренние действия нижнего уровня, скажем прочесть диалоговое окно. Каки в случае с целями, степень детализации зависит от квалификации потенциального пользователя, иначе дробление операций может быть совсем примитивным — для малоквалифицированных пользователей и крупным — для более продвинутых.

Методы, которыми может быть получен тот или иной результат.

Скажем, вызов файла может производиться из подменю «Документы» меню «Старт», если этот файл недавно использовался, или «кликаньем» на его иконке, если такая иконка выведена у нас на экран, или вызовом определенного диска, поиском в нем соответствующей папки, пока не найден этот файл, или с помощью поиска меню «Найти» и т.д. В методе GOMS каждый из путей представлен в виде иерархической структуры и в связке с соответствующим методом его выполнения.

Выборы — здесь речь идет о выборе того или иного метода, т.е. пути достижения результата. Идеология GOMS предполагает, что выбор метода — не случайный процесс: необходимо предсказать, какой именно метод будет использован и в каких условиях. Конечно, это зависит от нашего представления о потенциальном пользователе, от состояния системы, от конкретной цели.

Из всего этого видно, что анализ в терминах GOMS практически всегда лежит на пути декомпозиции некоей целостной задачи. Типичный GOMS-анализ состоит, следовательно, из какой-либо одной задачи сравнительно высокого уровня, и далее идет ее древовидная декомпозиция до уровня простейших действий. GOMS-анализ может содержать и характеристики деятельности. Глубина цепочки подцелей может использоваться для оценки требований к кратковременной памяти. Кроме того, в GOMS-анализе часто используют значения времени для каждого действия, чтобы прогнозировать временные затраты (см. разд. 4.2). Такие значения предварительно определяют в экспериментальных исследованиях. Методология модели GOMS является, по сути, базовой для большинства когнитивных моделей, используемых в человеко-компьютерном взаимодействии. Эта методология хорошо подходит для описания исполнительских действий, а при известных физических устройствах, на которых производятся эти исполнительские действия, она успешно используется и для прогнозирования времени выполнения различных задач. Пример декомпозиции на основе метода GOMS:

ЦЕЛЬ: ЗАКРЫТЬ-ОКНО

  • • [select GOAL: USE-MENU-METHOD
  • • MOVE-MOUSE-TO-FILE-MENU
  • • PULL-DOWN-FILE-MENU
  • • CLICK-OVER-CLOSE-OPTION

GOAL: USE-CTRL-W-METHOD

• PRESS-CONTROL-W-KEYS]

Для конкретного пользователя:

Правило 1: Select USE-MENU-METHOD unless another rule applies

Правило 2: If the application is GAME, select CTRL-W-METHOD

Вместе с тем в рамках этой методологии невозможно учесть такие важные вопросы, как соответствие предъявляемой информации уровню знаний пользователя, а значит, и обосновать объем необходимой тренировки, учесть динамику времени выполнения действий при разной тренированности и пр. Отметим, что предшественником этого метода является широко известный метод анализа деятельности Г.М. Зараков-ского (операционно-психофизиологический метод).

3.4.2. Модели, основанные на теории когнитивной сложности

Модель ССТ (Cognitive Complexity Theory) является продолжением GOMS-модели, в которую введена параллельная линия описания каждой подзадачи в терминах жесткой привязки ее к конкретным действиям пользователя. Каждый элемент иерархической структуры, сделанной по модели GOMS, является условием реализации определенного действия, т.е. каждый элемент представлен в виде продукционного правила: если (условие), то (действие). Условием при этом является содержание активной памяти пользователя в данный момент времени, и если условие имеет место, то продукционное правило выполняется.

Описание последовательностей таких продукционных правил, как и всякий ветвящийся процесс, удобнее всего представлять на языке LISP. Это позволяет существенно обогатить картину деятельности и даже количественно сравнивать интерфейсы, считая более простым тот из них, работа с которым представлена меньшим числом продукционных правил. Этот тип моделей имеет еще одно преимущество, заключающееся в возможности представить структуру деятельности пользователя и компьютерной системы в едином контексте, что позволяет видеть те области, где они противоречат друг другу, и добиваться соответствия. Таким образом, основными составляющими ССТ-моделей являются:

  • • параллельное описание;
  • • представление действий в виде процедур;
  • • преимущественное внимание к поведению новичков, а не опытных пользователей;
  • • возможность описания поведения при ошибках.

Меры: глубина структуры целей; число правил; сопоставление с описанием средства технической реализации.

Пример описания в терминах ССТ-модели четырех действий по вставке пробела представлен на рис. 3.1.

АКТИВНЫЕ ПРАВИЛА

СОДЕРЖАНИЕ РАБОЧЕЙ ПАМЯТИ

SELECT-INSERT-SPACE

  • (GOAL insert space) (NOTE executing space)
  • (LINE 5) (COLUMN 23)

INSERT-SPACE-MOVE-FIRST

INSERT-SPACE-DO IT

INSERT-SPACE-DONE

(SELECT-INSERT-SPACE

IF (AND (TEST-GOAL perform unit task) (TEST-TEXT task is insert space) (NOT (TEST-GOAL insert space)) (NOT (TEST-NOTE executing insert space)))

THEN ((ADD-GOAL insert space)

  • (ADD-NOTE executing insert space)
  • (LOOK-TEXT task is at %LINE %COLUMN)))

Рис. 3.1. Пример описания в терминах ССТ-модели

Конечно, эти модели имеют и свои ограничения. Так, принципиально возможно несколько способов описания одной и той же активности пользователя и изменений интерфейса. Кроме того, структура задач и соответствующих им действий для новичка и опытного пользователя будет разной, но такое различие невозможно провести для описания компьютерной системы. И наконец, объем описаний и продукционных правил для каждого типа интерфейса может оказаться непомерно большим.

3.4.3. Лингвистико-грамматические модели

Эти модели основаны на формализации языка, коим произведено описание человеко-компьютерного взаимодействия. В основном используются формы метаязыка Бекуса-Наура (Backus-Naur Form — BNF), хорошо известные в информатике. Приведем краткое пояснение. Дело в том, что для описания языка-объекта должен применяться некий язык высокого уровня, т.е. метаязык. Но метаязык также должен обладать некоторыми свойствами формального языка, чтобы однозначно определять конструкции языка-объекта. Следовательно, метаязык должен быть сначала описан сам, для чего также нужен язык. Естественно, может сложиться впечатление, что такой процесс никогда не закончится.

Однако доказано, что для описания любого метаязыка можно использовать язык естественный. Таким образом, для построения формального языка необходимо средствами естественного языка описать метаязык, а затем посредством метаязыка описать язык формальный.

Один из широко распространенных метаязыков известен как нотации Бекуса-Наура. Для формирования предложений в форме Бе-куса-Наура используются универсальные метасимволы: { <, >, ::=, | }. Первые два метасимвола называют угловыми скобками — они служат для обрамления нетерминального символа. Символ «::=» читается «по определению есть»; символ «» — «или». В предложениях, записанных в форме Бекуса-Наура, нетерминальный символ, стоящий в угловых скобках, играет роль определяемой конструкции языка-объекта. Терминальные символы отражают самый нижний уровень действий пользователя, т.е. нажатие на клавишу, «кликанье» мышью или передвижение мыши. Нетерминальные символы отражают более абстрактные действия и определены другими символами — как терминальными, так и нетерминальными.

Описание формального языка строится из последовательности формул, каждая из которых в левой части содержит один метасимвол, обозначающий некоторую конструкцию языка-объекта. Правая часть такой формулы содержит либо перечисление метасимволов и терминальных символов языка-объекта (никаких разделителей при этом не ставится), либо совокупности перечислений, разделенных символом «|». Правая и левая части объединяются в единую формулу знаком «::=».

Язык-объект можно считать полностью определенным в форме Бекуса-Наура, если любой нетерминальный символ можно представить последовательностью терминальных символов. В качестве примера можно рассмотреть определение понятия «идентификатор», которое используется во многих языках программирования. На естественном языке определение звучит следующим образом: «Идентификатор — это любая последовательность букв и цифр, начинающаяся с буквы». В форме Бекуса-Наура оно будет выглядеть следующим образом:

< идентификатор >::=< буква > | < идентификатор > < буква > |< идентификатор > <цифра>

<буква>::= a|b|c|d|e... <цифра>::= 0| 1|2|3|...|9

Видно, что в определении данного понятия присутствует рекурсив-ность, поскольку понятие «идентификатор» определяется через самое себя. Элементарным оказывается идентификатор из одной буквы.

Достоинство нотаций Бекуса-Наура в том, что они представляются в буквенном виде; неудобны нотации однообразностью способов построения предложений языка-объекта — запись оказывается громоздкой и плохо воспринимается.

Гораздо более наглядным следует считать другой способ описания формального языка, предложенный Николасом Виртом — создателем языка программирования PASCAL — и получивший название «синтаксические диаграммы». Синтаксическая диаграмма — это схема (графическое представление) описания какого-либо нетерминального символа языка-объекта. Схема всегда имеет один вход и один выход. Элементами схемы могут служить терминальные символы языка-объекта, заключенные в окружность (или овал), или нетерминальные символы (понятия) языка-объекта, заключенные в прямоугольник. Элементы соединяются между собой направленными линиями, указывающими порядок следования объектов в определяемом нетерминальном символе. Структура синтаксических диаграмм идентична структурам языков программирования, что позволило широко использовать диаграммы для написания трансляторов различных языков. Первым языком, описанным с помощью синтаксических диаграмм, был язык Паскаль. Нотации Бекуса-Наура и синтаксические диаграммы — это два альтернативных способа описания конструкций метаязыка, с помощью которого строится формальный язык.

После того как построена формальная грамматика и ею порожден язык, последний может быть использован для решения прикладных задач: коммуникации, хранения и обработки информации. Последний класс задач приводит к необходимости формулировки с помощью языков последовательностей обработки информации, т.е. алгоритмов, и их представлению в форме, доступной для понимания и исполнения лицом или техническим устройством, которые обработку производят.

Описание активности пользователя таким языком может отражать только действия пользователя, но не его восприятие интерфейса. Это, конечно, приводит к существенным погрешностям рассматриваемой модели, самой, наверное, общей из всех когнитивных моделей. Частично указанное ограничение смягчено введением в грамматику языка формы «поиск информации».

Попытка учесть знания, имеющиеся у пользователя, отражена в модификации описанного подхода, именуемой «грамматика связки задача-действие» (TAG — Task-Action Grammar). Отличие этого подхода — во введении некоторых параметризованных грамматических правил, позволяющих выделить повторяемость и учесть некоторые знания пользователя (например, верх противоположен низу). Для иллюстрации возможности выделение повторяемости (по сути, возможностей обобщения информации) приведем пример описания трех команд ОС UNIX: ср (сору — для копирования файлов), mv (move - для перемещения файлов) и In (link — для связывания файлов). Каждая из них имеет по два аргумента — имя исходного файла и имя файла назначения либо имя исходного файла и имя директории назначения. Тогда описание в форме Бекуса-Наура (сокращенно BNF) будет выглядеть так:

Копировать

::= ‘ср’

+

имя файла

+

имя файла

1 ‘ср’

+

имя файла

+

директория

Переместить

::= ‘mv’

+

имя файла

+

имя файла

| ‘mv’

+

имя файла

+

директория

Связать

::= ‘In’

+

имя файла

+

имя файла

| ‘In’

+

имя файла

+

директория

Средствами BNF нельзя выделить повторяющиеся места (т.е. общее) в этом описании. В TAG-модификации это сделать можно, и аналогичная запись будет выглядеть следующим образом:

Файл-опции ::= команда + имя файла + имя файла | команда + имя файла + директория

Команда (Опция = копировать) ::= ‘ср’

Команда (Опция = переместить) ::= ‘mv’

Команда (Опция = связать) ::= ‘In’

Преимущества записи в TAG-модификации очевидны. Таким образом, лингвистико-грамматические модели развивают иерархические описания модели GOMS в направлении повышения их содержательности.

3.4.4. Физические модели

Эта группа моделей рассматривает исключительно моторный, конечный исполнительский уровень деятельности пользователя, что обусловлено их ориентацией на оценку характеристик конкретных действий пользователя. Например, модель клавиатурного уровня рассматривает последовательности простых действий на клавиатуре, не превышающих обычно 20 с в одной серии. Понятно, что такая модель не распространяется на достаточно сложную деятельность. Базовым допущением этих моделей является иерархическая декомпозиция пользователем любой сложной задачи на подзадачи до самого нижнего, моторного уровня (как это делается в методе GOMS — см. разд. 4.4.1). Именно эти моторные действия и являются предметом рассмотрения данных моделей. Для создания физической модели исполнительские действия разбиваются на заранее установленные типы операторов, обычно включающие:

• К (Keystroking) — нажатие на клавиши, включая и вспомогательные клавиши (типа Shift, например).

  • В (Button) — нажатие на клавишу мыши.
  • Р (Pointing) — указание, передвижение мыши (трекбола и т. п.) к цели.
  • Н (Homing) — возврат руки, перемещение руки от мыши к клавиатуре.
  • D (Drawing) — рисование линий мышью.
  • М (Mental) — подготовка (планирование) моторных действий в уме.
  • R (Responce) — ответ системы, который пользователь может и про

игнорировать (например, если отправлена копия документа на печать).

Выполнение задачи может включать чередование разных операций. Расчет общего время выполнения операций предполагает аддитивность, т.е. времена каждой операции суммируются. Экспериментально полученные значения времени выполнения отдельных операций приведены в табл. 3.1.

Таблица 3.1

Экспериментально полученное время выполнения отдельных операций

Операторы

Пояснения

Время, с

К

Нажатие на клавишу клавиатуры:

Тренированный (90 слов/мин)

Средний (40 слов/мин)

  • 0,12
  • 0,28

Нетренированный

1,2

В

Нажатие на клавишу мыши: Движение только вниз или вверх

0,1

«Кликанье»

0,2

Р

Указание мышью. Закон Фиттса

0,llog2 (Д/5+0,5)[1]

Среднее движение

1,10

Н

Движение рук к клавиатуре и от нее

0,4

D

Рисование — зависит от величины области

М

Подготовка (планирование) действия в уме

1,35

R

Ответ системы

Конечно, все это время зависит от тренированности пользователя. Оператор «М» есть самое неясное место этой модели, его значение во многом зависит от квалификации пользователя, его восприятия ситуации. Использование данной модели требует внимания. С ее помощью удобно сравнивать пользовательские характеристики, скажем, разных способов ввода (например, либо путем «кликанья» на иконке, либо путем выбора из меню, либо путем нажатия одновременно на какие-то клавиши). При грамотном подходе оценка времени исполнительских действий показывает вполне удовлетворительные результаты, ошибка не превышает 20%. Особенно продуктивно применение этого подхода при часто повторяющихся задачах типа ввода данных или пользования телефоном.

К физическим моделям относится также так называемая модель трех состояний, разработанная специально для сравнения разных устройств ввода данных. Сопоставление мыши, трекбола и светового пера позволило выделить такие состояния, как перемещения без нажатия на клавишу (состояние 1) и перемещение с нажатием на клавишу, что обычно используется для перетаскивания иконки или файла (состояние 2). Однако световое перо имеет еще и третье состояние, когда оно не касается экрана, и это состояние обозначается цифрой 0.

Сенсорный экран аналогичен световому перу без клавиши, поэтому, когда палец не касается экрана, это состояние обозначается тоже как 0, а когда касается — 1. Таким образом, сенсорный экран может находиться в состоянии 0 или 1, а мышь — в состоянии 1 или 2. Учитывая, что состояния 0—2 и 0—1 не различаются между собой, существует всего три варианта. В случае, если устройство имеет несколько клавиш, то одно и то же состояние имеет место при нажатии на любую из них, и тогда обозначать их следует 2 ,2 ,2

J левая ’ средняя правая

Эта модификация физической модели позволяет характеризовать разные состояния устройства ввода через возможные способы ввода. Например, можно сравнить эффективность двух устройств в закрывании окна мышью и трекболом. Способ закрывания — путем перемещения мышью курсора к меню «Файл», затем нажатие на левую клавишу мыши и перетаскивание ее до наведения курсора на опцию «Выход», затем — отпускание клавиши. Используя таблицу коэффициентов закона Фиттса 2, имеем (обозначения операторов сохраняем, как указано выше):

Мышь

Р (к строке меню) = —107 + 223 log2(ll) = 664 мс;

Р (к опции «Выход») = 135 + 249 log2"(5) = 713 мс.

Трекбол

Р (к строке меню) = 75 + 300 log2(l 1) = 1113 мс.

Р (к опции «Выход») = —349 + 688 log2(5) = 1248 мс.

Из сопоставления времен видно преимущество мыши перед трекболом, во всяком случае для рассматриваемой операции.

Контрольные вопросы

  • 1. Что такое модель пользователя и пользовательский профиль?
  • 2. На какие типы разделяются модели пользователей?
  • 3. Описание моделей, определяемых социальным и организационным окружением USTM, OSTA и ETHICS.
  • 4. Существо методологии разработки программных продуктов, рассматривающих в едином контексте человеческие и организационные аспекты (SSM-методологии).
  • 5. Базовые положения SSM-методологии и примеры их использования.
  • 6. Описание моделей, базирующихся на когнитивных процессах.
  • 7. Общность и различия между тремя типами когнитивных моделей:
    • а) основанных на иерархической структуре задач и целей пользователя;
    • б) лингвистико-грамматическими;
    • в) физическими.
  • 8. Метод GOMS и его описание.
  • 9. Формы Бекуса-Наура, их роль и описание.
  • 10. Технологии декомпозиции действий пользователя и процесса функционирования системы.
  • 11. Правила описания портрета потенциального пользователя (персонажа).

Литература

Основная

  • 1. Раскин Д. Интерфейс: новые направления в проектировании компьютерных систем. — М.: Символ-Плюс, 2006.
  • 2. Солсо Р. Когнитивная психология: Пер. с англ. — М.: Тривола, 1996.
  • 3. Мандел Т. Разработка пользовательского интерфейса. — М.: ДМК, 2001.
  • 4. Ковальски Р. Логика в решении проблем. — М.: Наука, 1990.
  • 5. Dix A., Finlay J. and others (Eds). Human-Computer Interaction. — Printed in Great Britain, Glasgow. Publisher — Prentice Hall: 3rd edition, 2004.
  • 6. ISO/DIS 9241-13: User guidance.
  • 7. ISO/DIS 9241-14: Menu dialogues.
  • 8. ISO/DIS 9241-15: Command language dialogues.
  • 9. ISO/IEC 10741-1 Dialogue interaction — Cursor control for text editing.

Дополнительная

10. Тейз, Грибомон, Луи. Логический подход к искусственному интеллекту: Пер. с фр. — М.: Мир, 1990.

  • 11. Лорьер Ж.-Л. Системы искусственного интеллекта. — М.: Мир, 1991.
  • 12. MacKenzie S., Sellen A., Buxton W. A comparison of input devices in elemental pointing and dragging tasks. In: S.P.Robertson, G.M. Olson, and J.S. Olson, editors, Reaching through technology — CHI’91 conference proceedings, pages 161—166. Human Factors in Computing Systems. — N. Y.: ACM Press. April, 1991.
  • 13. Card S.K., Moran T.P., Newell A. The Psychology of Human Computer Interaction. — Lawrence Erlbaum, 1983.
  • 14. Bovair S., Kieras D.E., Poison P.G. The acquisition and performance of textediting skill: a cognitive complexity analysis // Human-Computer Interaction. 1990. Vol. 5. № 1. Pl-48.
  • 15. Schiele F., Green T. HCI formalisms and cognitive psychology: the case of taskaction grammars // M.D. Harrison and H.W. Thimbleby (Eds). Formal methods in Human-Computer Interaction. — Cambridge University Press, 1990. Ch. 2.

  • [1] В данном выражении D — расстояние до цели, a S - размер цели.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >