Ігрове прийняття рішень в мультиагентних системах

Authors:

П. Кравець

Національний університет «Львівська політехніка», кафедра інформаційних систем та мереж

Досліджується проблема прийняття рішень ув мультиагентних системах за допомогою методів стохастичних ігор. Сформульовано ігрову задачу в умовах невизначеності. Розглянуто ігрові моделі без обміну та з обміном інформацією, без відмов та з відмовами гравців. Розроблено рекурентні методи для розв’язування ігрової задачі. Визначено умови збіжності ігрових методів до колективних станів рівноваги.

The problem of decision making in multiagent systems with aid of stochastic game methods is investigated. The game problem formulation in uncertainty conditions is executed. The game models without (and with) exchange information are considered. The game models without (and with) failure of players are considered. The recurrence methods for the game task solving are developed. The convergence conditions of game methods to collective equilibrium states is defined.

Катренко А.В., Пасічник В. В. Теорія прийняття рішень. — К.: BHV, 2008.
Бурков В.Н., Новиков Д. А. Теория активных систем: состояние и перспективы. — М.: СИНТЕГ, 1999.
Wooldridge M. An Introduction to Multiagent Systems. John Wiley & Sons (Chichester, England), 2002.
Трухаев Р. И. Модели принятия решений в условиях неопределенности. — М.: Наука, 1981.
Королюк В. С. Стохастические модели систем. — К.: Наукова думка, 1989.
Майн Х., Осаки С. Марковские процессы принятия решений. — М.: Наука, 1977.
Ремарович С. Динамічна координація програмних агентів на основі онтологічної структури // Проблеми програмування. — 2006. — № 2–3. — С. 487 — 492.
Цыпкин Я. З. Основы теории обучающихся систем. — М.: Наука, 1970.
Срагович В. Г. Адаптивное управление. — М.: Наука, 1981.
Gerhard Weiss and Sandip Sen, editors. Adaptation and Learning in Multiagent Systems. Springer Verlag, Berlin, 1996.
Варшавский В. И. Коллективное поведение автоматов. — М.: Наука, 1973.
Амосов Н.М., Касаткин А.М., Касаткина Л.М., Талаев С. А. Автоматы и разумное поведение. Опыт моделирования. — К.: Наукова думка, 1973.
Растригин Л.А., Рипа К.К., Тарасенко Г. С. Адаптация случайного поиска. — Рига: Зинатне, 1973.
Watkins C.J.C.H., Dayan P. Q-Learning // Machine Learning, No. 8. — Kluwer Academic Publishers, Boston. — 1992. — PP. 279–292.
Уоссермен Ф. Нейрокомпьютерная техника — М.: Мир, 1992.
Goldberg D.E. Genetic Algorythms in Search, Optimization and Mashine Learning. — Addison-Vesley, 1989.
Finn V. Jensen. Bayesian Networks and Decision Graphs. — Springer, 2001.
Гладун В. П. Эвристический поиск в сложных средах. — К.: Наукова думка, 1977.
Стогний А.А., Кондратьев А. И. Теоретико-игровое информационное моделирование в системах принятия решений. — К.: Наукова думка, 1986.
Fudenberg D., Levine D. K. The Theory of Learning in Games. — Cambridge, MA: MIT Press, 1998.
Назин А.В., Позняк А. С. Адаптивный выбор вариантов: Рекуррентные алгоритмы. — М.: Наука, 1986.
Воробьев Н. Н. Основы теории игр: Бескоалиционные игры. — М.: Наука, 1984.
Цыпкин Я.З., Позняк А. С. Рекуррентные алгоритмы оптимизации в условиях неопределенности // Итоги науки и техники. Сер. Техническая кибернетика. — 1989. — Т. 16. — С. 3 — 70.
Вазан М. Стохастическая аппроксимация. — М.: Мир, 1972.
Невельсон М.Б., Хасьминский Р. З. Стохастическая оптимизация и рекуррентное оценивание. — М.: Наука, 1972.