Принятие решений с помощью Базы Знаний, представленной в виде бинарного дерева.

База Знаний предназначена для представления и сохранения в памяти знаний о функциональных свойствах среды и необходима для принятия решений. Как уже отмечалось, решения принимаются с двумя целями: обеспечить выживание объекта управления и накапливать новые знания, которые в свою очередь будут способствовать выживанию (или наоборот - выживать, чтобы накапливать новые знания). Чтобы не нагружать управляющую систему лишней интеллектуальной задачей — необходимостью каждый раз выбирать, к какой цели следует стремиться — к выживанию или к накоплению новых знаний, природа замаскировала эту проблему, заменив обе эти целевые функции одной целью. Эта универсальная цель состоит в постоянном стремлении управляющей системы к повышению общей эмоциональной оценки состояния. Эта цель достигается только через распознавание образов с возможно более высокими положительными оценками и вытеснение образов с отрицательными оценками. И то и другое, а также сам механизм принятия и реализации решений и должны одновременно способствовать выживанию объекта управления и накоплению новых знаний. Опишем, как это можно реализовать, если использовать БЗ в форме описанного выше бинарного дерева.

Пусть к текущему моменту подсистемой ФРО было сформировано 3 образа: 01, 02 и Оз, а подсистема эмоций определила для этих образов эмоциональные оценки 5'1, 3’2 и 5з. Положим для примера, что эти оценки имеют следующие значения 51 = «—3», = «2» и 5з = «—4». И пусть в текущий момент Ь

подсистема ФРО распознала образ 0з. Управляющей системе следует принять решение, какое действие следует совершить в следующий момент времени ?+1. Управляющая система обращается к своей БЗ (рис. 3.62) и смотрит, какой из ее слоев адекватен текущей ситуации, т. е. содержит знания, которые можно применить в текущей ситуации. Пусть в БЗ найдется такой слой, который изображен на рис. 3.61. Этот слой знаний применим в текущей ситуации, так как условие применимости выполняется:

Управляющая система, отделив пригодный слой БЗ, начинает рассчитывать, какое действие, в случае его выполнения, принесет наибольшую прибавку общей эмоциональной оценке. Для выбора лучше всего использовать «листья» дерева — действия, не имеющие «сыновей» и наиболее удаленные от корня дерева, так как именно они учитывают наибольшее число последствий наибольшее число образов результатов. Это наиболее умные, дальновидные действия. В дереве, представленном на рис. 3.61, имеется 5 листьев: /_)[!. 13]. ?>1!, 1){ и П. Посчитаем, какие приращения эмоциональных оценок Д,9 могут дать эти действия, учитывая эмоциональные оценки образов и вид влияния действия на образы, отраженный показателями связи. Напомним, что

  • а) если образ не распознан и мы его вызываем (показатель связи равен 1), то получаем приращение оценки, соответствующее знаку его эмоциональной оценки,
  • б) если образ был распознан и мы его вытесняем (—1), то получаем убыль оценки в соответствии с ее знаком,
  • в) если образ не был распознан и мы его блокируем (—1), то приращения оценки не получаем,
  • г) если образ был распознан и мы его блокируем (1), то приращения оценки также не получим.

Итак:

Отсюда следует, что в данном случае следует выбрать действие 1)Ц. так как оно обещает дать наибольшее приращение эмоциональной оценки. Действительно, это действие обещает вытеснить распознанный образ Оз с большой отрицательной оценкой «—4», одновременно вызвать распознавание образа 0-2 с большой положительной оценкой, хотя при этом и вызывает образ 0 с отрицательной оценкой «—3». В совокупности этот результат лучше, чем все другие известные УС варианты. Выбирая действие, которое обещает дать наибольшее приращение эмоциональной оценке, УС тем самым способствует выживанию объекта управления (при условии, что «приятные» образы одновременно и полезны объекту управления, о чем должен был позаботиться естественный отбор).

Обратим внимание, что описанная процедура принятия решения одновременно содержит в себе и компонент, направленный на достижение другой цели накопление новых знаний. Действительно, в результате детерминированного выбора действия, направленного на обеспечение выживания, УС выбрала некоторое действие, в данном случае /_)!,’. Однако под этим идентификатором скрывается определенное множество «степеней свободы» — вариантов воздействий на среду', которые с точки зрения имеющихся у УС на текущий момент знаний равнозначны, приводят к одинаковым последствиям. В данном случае это множество (1/5, щ). Выбор конкретной степени свободы из этого множества должен производиться уже случайным способом. Вот этот элемент случайности и обеспечивает поиск и накопление новых знаний. Никто пока не знает, как та или иная степень свободы из выбранного множества влияет на образы, которые еще не сформированы. В случае рассматриваемого примера (рис. 3.61), мы не знаем заранее, как степени свободы ц-, и щ влияют на еще не сформированный образ О4, возможно, что они не влияют совсем, либо влияют по-разному, либо влияет только один из них и т. д. Выбирая эти степени свободы случайным способом, УС постепенно найдет ответы на эти вопросы, т. е. расширит свои знания. Далее это будет распространяться на все сформированные впоследствии образы.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >