Дискретные модели активных систем
Поясним последнее утверждение, обобщив описание, технологию и технику построения и исследования
|
Информ
ированн
ость |
Тип
неопредел
енности |
Вид
неопредел
енности |
Разделы
теории
управления |
Основные работы |
М1 |
С |
|
|
ТАС, ИТИС, ТК |
См. раздел 4. |
М2 |
С |
внутр. |
инт. |
ТАС, ИТИС |
113,123,153,276,
336 |
М3 |
С |
внутр. |
вер. |
ИТИС |
336 |
М4 |
С |
внутр. |
неч. |
ТАС |
28,372 |
М5 |
С |
внешн. |
инт. |
ТАС, ИТИС |
123,153,279 |
М6 |
С |
внешн. |
вер. |
ТАС, ТК |
84,119,152,154,229,
237,307,308,364,
367,377,381,400 |
М7 |
С |
внешн. |
неч. |
ТАС |
365,366,372,378 |
М8 |
А |
внутр. |
инт. |
ТАС, ИТИС, ТР |
См. раздел 5. |
М9 |
А |
внутр. |
вер. |
ТАС, ИТИС |
336,371,410,413 |
М10 |
А |
внутр. |
неч. |
ТАС |
372,382 |
М11 |
А |
внешн. |
инт. |
ТАС, ИТИС, ТР |
195,336,370 |
М12 |
А |
внешн. |
вер. |
ТАС, ТК |
152,307,336 |
М13 |
А |
внешн. |
неч. |
ТАС |
372,382 |
|
Таблица 2. Модели АС с неопределенностью |
моделей механизмов стимулирования как в детерминированных активных системах, так и в АС с различными типами и видами неопределенности.
После описания модели, то есть задания в соответствии с введенными выше параметрами модели и системой классификаций задач управления в АС класса исследуемых активных систем, определяется рациональное поведение АЭ: на основании известных предпочтений АЭ на множестве результатов деятельности (эти предпочтения зависят от используемого центром механизма управления) и имеющейся информации о неопределенных факторах (взаимосвязи между действиями АЭ и результатами его деятельности) определяются предпочтения АЭ на множестве его стратегий (действий и/или сообщаемых оценок). В случае интервальной неопределенности этот переход осуществляется с использованием принципа МГР, в случае вероятностной (нечеткой) неопределенности целевая функция АЭ на множестве результатов его деятельности совместно с распределением вероятностей (нечеткой информационной функцией) индуцирует на множестве допустимых стратегий целевую функцию - ожидаемую полезность (индуцированное нечеткое отношение предпочтения (НОП) и т.д.). Множество выбора (решений игры) при заданном множестве стратегий и предпочтениях АЭ, выражаемых, например, его целевой функцией, НОП и т.д., определяется стандартным образом. В случае, если множество выбора состоит более, чем из одного элемента, необходимо доопределить однозначно (используя ГБ или МГР) выбор АЭ. Этот выбор будет зависеть от механизма управления, эффективность которого задается значением целевой функции центра на множестве выбора АЭ (если предпочтения центра зависят от неопределенных параметров, то необходимо найти его детерминированную индуцированную систему предпочтений). Следует отметить, что структура предпочтений центра и АЭ (возможность ранжирования стратегий) в большинстве случаев позволяет определять выбор (недоминируемые стратегии) достаточно тривиально.
Имея критерий сравнения эффективностей различных систем стимулирования на их допустимом множестве, задача синтеза в АС с неопределенностью (и в детерминированных АС - см. выше) формулируется следующим образом: найти допустимую систему стимулирования, имеющую максимальную эффективность. Все трудности при решении этой задачи (поиска точки в области функционального пространства, максимизирующей заданный функционал, переменные которого в свою очередь сложным образом зависят от искомой функции) возникают потому, что она в общем случае не может быть сведена к какой-либо стандартной задаче оптимизации. В детерминированном случае свойства решения (которое является скачкообразной или компенсаторной системой стимулирования) дается теоремой Ю.Б. Гермейера [276]. В ряде АС с неопределенностью удается дискретные задачи стимулирования свести к тем или иным известным оптимизационным (см. обзоры [152, 153, 371]). Высокая вычислительная сложность алгоритмов численного решения дискетных задач и отсутствие возможности анализа зависимости оптимального решения от параметров модели, приводят к необходимости разработки методов получения именно аналитического решения. Поэтому основной акцент в ТАС делается именно на поиск аналитического решения задачи синтеза.
Лобовой поиск аналитического решения, как правило, не приводит к успеху - в большинстве случаев приходится угадывать решение, а затем доказывать его оптимальность, благо, что эвристические принципы угадывания, да и техника формального доказательства для различных моделей АС, имеют много общего.
Техника доказательства большинства результатов использует анализ множества реализуемых действий - тех действий АЭ, которые он выбирает (гарантированно или по ГБ) при заданной функции стимулирования. Критерий сравнения различных систем стимулирования по эффективности может быть сформулирован в терминах множеств реализуемых действий: чем шире множество действий, реализуемых системой стимулирования, тем в рамках ГБ выше ее эффективность (двойственным подходом является сравнение минимальных затрат на стимулирование по реализации фиксированного действия) [382].
Поэтому оптимальная система стимулирования (точнее - их класс) имеет максимальное множество реализуемых действий. Следовательно, для того, чтобы доказать оптимальность некоторого класса систем стимулирования достаточно показать, что не существует другой допустимой системы стимулирования, имеющей большее множество реализуемых действий. Этот подход оказывается плодотворным не только при доказательстве оптимальности, но и при исследовании свойств решения, влияния неопределенности и т.д.
Более того, в рамках каждой из перечисленных выше базовых моделей М1-М13 возможны различные постановки задачи стимулирования - прямые и обратные, первого и второго рода, с различными представлениями целевых функций участников АС и т.д. В то же время, опыт их исследования свидетельствует, что достаточно исследовать полностью одну из них - решение остальных задач данного класса требует лишь незначительных модификаций.
В качестве иллюстрации использования единства предложенного подхода сформулируем общую для всех моделей АС с неопределенностью последовательность их исследования, включающую следующие этапы:
1. Описание модели: определение целевых функций и допустимых множеств, их свойств, а также порядка функционирования и информированности участников АС и т.д.
2. Определение рационального поведения АЭ в рамках рассматриваемой модели: задание процедуры (метода) устранения неопределенности и рационального выбора АЭ (определение множества решений игры - множества реализуемых действий).
3. Определение эффективности механизма стимулирования и формулировка, собственно, задачи синтеза оптимального механизма стимулирования.
4. Решение задачи синтеза: поиск аналитического решения и/или разработка алгоритмов численного решения задачи и исследование их свойств: сходимости, сложности и т.д.
5. Нахождение необходимых и достаточных условий оптимальности.
6. Анализ оптимального решения:
а) свойства оптимального решения и множества реализуемых действий, содержательные интерпретации;
б) влияние неопределенности на эффективность и свойства оптимального механизма стимулирования;
в) влияние параметров модели и определения рационального поведения на эффективность и свойства оптимального механизма стимулирования, в том числе - анализ устойчивости оптимального решения.
7. Исследование частных случаев (при усилении предположений и допущений о параметрах и свойствах модели АС) и возможностей обобщения (соответственно, при ослаблении).
8. Исследование устойчивости решений и адекватности модели моделируемой системе.
9. Внедрение модели: корректировка, разработка рекомендаций по практическому использованию, создание вычислительных средств, автоматизированных систем поддержки принятия решений и имитационных моделей.
Итак, этапы 1-3 включают описание АС и постановку задачи, этапы 4-5 соответствуют аналитическому и/или численному решению задачи, этапы 6-8 - исследованию модели и свойств оптимального решения, этап 9 - внедрению и практическому использованию результатов исследования.
Обнадеживающим представляется тот факт, что оптимальными в базовых моделях оказываются достаточно простые системы стимулирования . Так, результаты теоретического исследования подтверждают высокую эффективность следующих широко распространенных на практике систем стимулирования (см. их подробное описание в четвертом разделе): - скачкообразных (С-типа), компенсаторных (К-типа) и пропорциональных (L-типа) [299, 363, 382]. Отдельно следует отметить, что ни в одной из базовых моделей пропорциональные системы стимулирования (L-типа) не доминируют скачкообразные и компенсаторные.
Таблица 3 содержит сводку результатов теоретического исследования задач стимулирования в АС с неопределенностью (см. подробное описание, а также вводимые предположения в [382]): для базовых моделей М1-М13 (за исключением М3 и М9, которые на сегодняшний день недостаточно полно исследованы, быть может - в силу затруднений в их содержательных интерпретациях) указаны оптимальные системы стимулирования ((ОСС) - и означает -одновременно, или означает - в зависимости от вводимых предположений), соотношение между эффективностями K и гарантированными эффективностями Kg стимулирования в АС с неопределенностью и соответствующих детерминированных АС (K0 и Kg0), изменение эффективности (гарантированной эффективности) с ростом неопределенности (t - возрастает, n[ - убывает, t^ -может как возрастать, так и убывать).
Отдельного обсуждения заслуживает влияние
неопределенности на эффективность управления АС, так как возможность использования единого подхода к анализу базовых моделей механизмов управления (стимулирования) в АС с различными типами и видами неопределенности позволяет сделать ряд общих выводов о роли неопределенности в управлении АС. В детерминированной активной системе оптимальным оказывается целое множество систем стимулирования - от наиболее жестких -
|
ОСС |
K/Ko |
K/Kg0 |
K |
Kg |
М1 |
С и К |
1 |
1 |
|
|
М2 |
С и К |
1 |
1 |
і |
і |
М4 |
С или К |
?1 |
1 |
П |
і |
М5 |
К |
1 |
1 |
і |
і |
М6 |
С или К |
1 |
1 |
і |
і |
М7 |
С или К |
1 |
1 |
t |
і |
М8 |
С |
?1 |
1 |
n |
і |
М10 |
С и К |
1 |
1 |
і |
і |
М11 |
С и К |
1 |
1 |
і |
і |
М12 |
С или К |
?1 |
1 |
ti |
і |
М13 |
С |
1 |
1 |
і |
і |
|
Таблица 3. Результаты исследования задач стимулирования в АС с неопределенностью |
скачкообразных до наиболее слабых - компенсаторных. Все задачи стимулирования в АС с неопределенностью, рассматриваемые в ТАС, удовлетворяют принципу соответствия: при предельном переходе (стремлении неопределенности к нулю) они переходят в детерминированные АС, а их оптимальные решения - в оптимальные решения соответствующих детерминированных задач стимулирования. Причем в большинстве случаев оптимальными оказываются граничные системы стимулирования - С-типа или К-типа. Таким образом, множество оптимальных систем стимулирования в АС с неопределенностью является подмножеством (иногда собственным) систем стимулирования, оптимальных в соответствующих детерминированных активных системах.
Ключевыми понятиями детерминированной теории активных систем являются понятия согласованного плана и согласованной системы стимулирования (см. выше). Если при исследовании моделей механизмов стимулирования в АС с неопределенностью основной акцент делается на анализ множества реализуемых действий, а условие реализуемости есть ни что иное, как условие согласованности (в ТК этому термину соответствует ICC - Incentive Compatibility Constraint - ограничение согласованности стимулирования [152]), то вопрос о том, что следует понимать под согласованностью плана в АС с неопределенностью заслуживает особого обсуждения. Так как, например, в вероятностных АС, результат деятельности АЭ является случайной величиной, то вряд ли разумно определять план как некоторую точку (хотя, задавая область, можно считать ее планом, который выполняется, если при выборе АЭ реализованного действия результат деятельности оказывается в этой области, например, с вероятностью не ниже заданной и т.д.). Считать планом точку скачка в системах стимулирования С-типа (проводя полную аналогию с детерминированным случаем) нецелесообразно по тем же причинам. Так или иначе, даже не наблюдая действий АЭ, центр, подбирая систему стимулирования, управляет именно выбором действия. Поэтому можно считать планом действие, реализуемое заданной системой стимулирования (такой план всегда согласован). Важный методологический вывод, который следует из проведенного анализа, заключается в следующем: непосредственное обобщение понятий плана и согласованного плана с детерминированной модели на модели АС с неопределенностью невозможно, так как в общем случае в последних план (в детерминированном понимании) не совпадает ни с выбором (действием) АЭ, ни с результатом его деятельности. Поэтому требуется дополнительное исследование и введение нового общего понятия плана для АС с неопределенностью, которое удовлетворяло бы принципу соответствия и включало в себя детерминированное определение как частный случай.
Вполне согласованными с практическим опытом представляются результаты о том, что во всех базовых моделях с ростом верхнего ограничения механизма стимулирования расширяется множество реализуемых действий, что совместно с результатами анализа влияния информированности участников на эффективность управления АС позволяет расширить класс моделей АС, для которых применима уже разработанная технология и техника анализа, включив в него АС с платой за информацию, смешанной неопределенностью, некоторые динамические и многоэлементные АС и т.д. Поэтому, по-видимому, целесообразно следовать следующей рекомендации: первыми кандидатами на оптимальность в любой новой (неисследованной) социальноэкономической системе являются скачкообразные и компенсаторные системы стимулирования. Имеющиеся методы исследования эффективности систем стимулирования позволяют достаточно просто проверять оптимальность этих кандидатов в широком классе реальных систем и их моделей.
Принципу соответствия удовлетворяют также большинство выводов о влиянии неопределенности на эффективность стимулирования, причем, что представляется крайне важным, опять же, общей является следующая технология анализа роли неопределенности в АС с неопределенностью. Для двух АС, отличающихся либо множеством значений неопределенного фактора, либо той информацией, которую имеют о нем участники АС, вводится критерий сравнения величин неопределенности, с одной стороны учитывающий специфику задачи, а с другой -согласованный с известными мерами неопределенности (например -энтропией и т.д.) [381, 382]. Далее показывается, что в АС с большей неопределенностью множество действий АЭ, реализуемых любой допустимой системой стимулирования, не шире (шире), чем в АС с меньшей неопределенностью, что позволяет сразу сделать вывод о сравнительной эффективности оптимальных систем стимулирования в этих АС.
При использовании гипотезы благожелательности в ряде базовых моделей АС с неопределенностью (например, М4, М7, М8, М12) эффективность стимулирования оказывается не меньше, чем в соответствующих детерминированных АС, и возрастает с ростом неопределенности (содержательные интерпретации и подробное обсуждение этого парадокса приведены в [365, 372, 382]). Если же эффективность управления (стимулирования) определяется как гарантированное значение целевой функции центра на множестве реализуемых действий, то для всех моделей, независимо от типа и вида неопределенности, справедливы следующие выводы: эффективность стимулирования в АС с неопределенностью не выше, чем в детерминированной АС, причем с ростом неопределенности эффективность стимулирования уменьшается, а с уменьшением неопределенности - возрастает и стремится к аналогичному показателю для соответствующей детерминированной активной системы.
Общность описания и технологии анализа задач стимулирования в различных социально-экономических системах с неопределенностью позволяет также сравнивать неопределенности различных видов, выделяя классы интервалов, вероятностных распределений и нечетких информационных функций, то есть информацию о неопределенном параметре, при которых эффективность стимулирования удовлетворяет заданным свойствам (например, не ниже заданной и т.д.) [382].
Как отмечалось выше, во всех моделях величина неопределенности связана с информированностью участников: чем большей информацией обладает центр и/или АЭ, тем меньше неопределенность. В большинстве известных моделей считается, что участники АС, обладая на момент принятия решения некоторой информацией, могут использовать эту информацию и только ее. Возможность получения дополнительной информации отсутствует (использование механизмов с сообщением информации от АЭ центру не является исключением: несмотря на то, что центр получает новую информацию, он получает ее после выбора процедуры планирования, причем сам факт обмена информацией изначально заложен в механизме функционирования). Такой порядок функционирования достаточно распространен на практике. Однако встречаются ситуации, в которых участники АС имеют возможность до принятия решения целенаправленно получать информацию от окружающей среды или от других участников системы, причем, в большинстве случаев, для получения этой информации необходимы некоторые финансовые или какие-либо другие затраты.
Механизмы управления, в которых участники АС имеют возможность за плату приобрести информацию, получили название механизмов с платой за информацию [233, 234, 377, 382]. При использовании механизмов с платой за информацию имеют место две противоположные тенденции. С одной стороны, получение дополнительной информации может повысить эффективность управления. С другой стороны, часть средств, потраченная на приобретение информации, уменьшает доход участника АС или его возможности по управлению, что может привести к снижению эффективности управления. Если точность и количество поступающей информации монотонно связаны с затратами по ее получению, то, очевидно, существует некоторый оптимум -компромисс между снижением эффективности, вызванным уменьшением управляющих возможностей, и ее ростом, обусловленным большей информированностью. При этом не исключается, что возможны ситуации, в которых приобретать дополнительную информацию вообще не имеет смысла (плата слишком высока), или наоборот, оказывается целесообразным полное устранение неопределенности.
Существенной чертой механизмов с платой за информацию является добровольность ее приобретения: каждый из участников АС вправе самостоятельно решать приобретать ли ему дополнительную информацию и в каком объеме. Понятно, что, в принципе, приобретать информацию могут как центр, так и активные элементы. Важно также различать, у кого приобретается информация - у третьих лиц, не входящих в состав АС, или у участников самой активной системы. Так, например, возможны механизмы с сообщением информации в АС, в которых центр может, заплатив АЭ определенную сумму, например, уменьшить диапазон возможных (неизвестных для него) значений неопределенного параметра, а затем использовать механизм планирования уже в условиях меньшей неопределенности. Задача манипулирования при этом все равно возникает, однако, следует учитывать, что плата за информацию может изменить значение целевой функции АЭ.
Для получения ответа на вопрос целесообразно ли использование механизмов с платой за информацию и определения оптимальной величины этой платы необходимо в каждом конкретном случае:
1. Определить зависимость информированности участников АС от величины платы за информацию.
2. Найти соотношение между эффективностью управления и информированностью участников (величина платы за информацию выступает при этом как параметр).
3. Вычислить величину платы за информацию,
максимизирующую эффективность управления.
Дискретные модели активных систем
Одним из выделенных выше оснований классификации является структура множеств допустимых стратегий участников АС. Важный класс составляют так называемые дискретные АС, в которых множество возможных действий АЭ конечно.
Понятно, что все результаты, полученные для непрерывных АС (в которых множество допустимых действий является, например, отрезком действительной оси) могут быть переформулированы и для частного случая дискретных АС.
Тем не менее, дискретные АС интересны тем, что для них иногда удается, используя технику дискретной оптимизации, получить результаты в тех случаях, когда анализ их непрерывных аналогов трудоемок или затруднителен. Поэтому перечислим основные направления их исследования.
При описании задач синтеза согласованных по выполнению плана механизмов стимулирования выше уже упоминалось, что решение ряда задач согласованного планирования сводится к анализу стандартных задач дискретной оптимизации (теории расписаний и др.) [61-64, 395].
Вторым направлением является использование аппарата теории графов при решении задач синтеза согласованных механизмов для дискретных моделей АС [85, 107, 123]. Качественно, основная идея заключается в том, что, поставив в соответствие действиям АЭ вершины взвешенного графа, условия согласования (условия реализуемости определенных действий и т.д.) можно интерпретировать как систему ограничений на потенциалы вершин этого графа.
Следовательно, задачу поиска оптимального или согласованного механизма можно формулировать как задачу о потенциалах, для которой известны общие условия существования решения (формулируемые обычно в виде ограничений на свойства контуров и путей в графе), а также хорошо развита техника анализа (использующая, как правило, теорию двойственности) свойств решения.
И, наконец, третьим направлением является изучение моделей АС со сравнительными предпочтениями АЭ, то есть таких систем, в которых интересы и предпочтения АЭ на конечном множестве его возможных действий описываются не целевой функцией (или функцией, дохода, затрат и т.д.), как это делается в большинстве моделей ТАС, а метризованным бинарным отношением. В [45,372,382] показано, что в детерминированных АС и в ряде АС с неопределенностью задание предпочтений АЭ в виде аддитивно транзитивных метризованных отношений и целевых функций эквивалентно (в смысле класса описываемых предпочтений и, следовательно, решений задач управления).
В то же время, метризованные отношения (в частности, не обладающие аддитивной транзитивностью) отражают более широкий класс предпочтений АЭ, и их дальнейшее изучение представляется перспективным направлением будущих исследований.
Базовые механизмы управления активными системами
Подробно исследованные в ТАС практически значимые детализации общих задач планирования и стимулирования получили условное название базовых механизмов управления. Они являются элементами конструктора, используя которые можно синтезировать механизмы управления теми или иными классами реальных АС.
Механизмы комплексного оценивания
Для выработки эффективных управляющих воздействий, начиная с этапа целеполагания и заканчивая этапом оперативного управления, центру необходимо обладать достаточной информацией о поведении управляемых субъектов, в частности - относительно результатов их деятельности. В сложных (многоэлементных, многоуровневых АС, деятельность которых описывается многими критериями) системах в силу ограниченности возможностей центра по переработке информации или в силу отсутствия детальной информации целесообразно использование механизмов комплексного оценивания, которые позволяют осуществлять свертку показателей, то есть агрегировать информацию о результатах деятельности отдельных АЭ.
При исследовании механизмов комплексного оценивания решаются две задачи. Первая - синтез процедуры агрегирования информации, которая адекватно отражала бы содержательные аспекты взаимодействия участников АС и позволяла центру принимать решения на основании агрегированной информации.
Это направление тесно связана с проблематикой многокритериальной оптимизации и теорией информационных управляющих систем.
Содержание раздела