Ігрова задача колективного стимулювання дій агентів

Authors:

Кравець П.О.

Національний університет «Львівська політехніка», кафедра інформаційних систем та мереж

Сформульовано ігрову задачу колективного стимулювання елементів (агентів) активних систем. Запропоновано рекурентний метод розв’язування стохастичної гри. Побудовано ігровий алгоритм та проведено комп’ютерне моделювання стохастичної гри з колективним стимулюванням агентів. Досліджено вплив параметрів задачі на збіжність ігрового методу.

1. Gerhard Weiss and Sandip Sen, editors. Adaptation and Learning in Multiagent Systems. Springer
Verlag, Berlin, 1996. 2. Stone P. Layered Learning in Multiagent Systems. MIT Press, 2000. 3.
Wooldridge M. An Introduction to Multiagent Systems. John Wiley & Sons (Chichester, England), 2002. 4.
Vidal J. M. Fundamentals of Multiagent Systems / http://jmvidal.cse.sc.edu/netlogomas/ABTgc.html . –
2007. 5. Бурков В.Н., Новиков Д.А. Теория активных систем: состояние и перспективы. – М.:
СИНТЕГ, 1999. 6. Новиков Д.А. Механизмы стимулирования в организационных системах. – М.:
ИПУ РАН, cерия "Научные издания", 2003 . 7. Новиков Д.А. Модели команд в теории активных
систем // Теория активных систем / Труды международной научно-практической конференции
(14-15 ноября 2007 г., Москва, Россия). Общая редакция – В.Н. Бурков, Д.А. Новиков. – М.: ИПУ
РАН, 2007. 8. Орловский С.А. Проблемы принятия решений при нечеткой исходной информации. –
М.: Наука, 1981. 9. Трухаев Р.И. Модели принятия решений в условиях неопределенности. – М.:
Наука, 1981. 10. Растригин Л.А., Рипа К.К., Тарасенко Г.С. Адаптация случайного поиска. – Рига:
Зинатне, 1973. 11. Срагович В.Г. Теория адаптивных систем. – М.: Наука, 1976. 12. Цыпкин Я.З.
Основы теории обучающихся систем. - М.: Наука, 1970. 13. Доманский В.К. Стохастические игры
// Математические вопросы кибернетики. – 1988. – № 1. – С. 26 – 49. 14. Fudenberg D., Levine D.K. The Theory of Learning in Games. MIT Press, 1998. 15. Катренко А.В. Дослідження операцій.
Підручник. – Львів: Магнолія плюс, 2004. 16. Воробьев Н.Н. Основы теории игр: Бескоалиционные
игры. – М.: Наука, 1984. 17. Мулен Э. Теория игр с примерами из математической экономики. – М.:
Мир, 1985. 18. Стогний А.А., Кондратьев А.И. Теоретико-игровое информационное моделирование
в системах принятия решений. - К.: Наукова думка, 1986. 19. Назин А.В., Позняк А.С. Адаптивный
выбор вариантов: Рекуррентные алгоритмы. – М.: Наука, 1986. 20. Цыпкин Я.З., Позняк А.С.
Рекуррентные алгоритмы оптимизации в условиях неопределенности // Итоги науки и техники.
Сер. Техническая кибернетика. – 1989. – Т. 16. – С. 3 – 70. 21. Поляк Б.Т., Цыпкин Я.З.
Псевдоградиентные алгоритмы адаптации и обучения // Автоматика и телемеханика. - 1973. - №
3. - С. 45-68. 22. Опойцев В.И. Равновесие и устойчивость в моделях коллективного поведения. - М.:
Наука, 1977. 23. Вазан М. Стохастическая аппроксимация. – М.: Мир, 1972. 24. Невельсон М.Б.,
Хасьминский Р.З. Стохастическая оптимизация и рекуррентное оценивание. – М.: Наука, 1972.