Марківські методи навчання у системах прийняття рішень

Authors:

Кравець П.О., Проданюк О.М.

Національний університет «Львівська політехніка», кафедра інформаційних систем та мереж

Досліджується проблема оптимального прийняття рішень за допомогою марківських методів навчання. Сформульовано задачу прийняття рішень, описано методи детермінованого та стохастичного навчання. Розроблено алгоритмічне та програмне забезпечення для моделювання прийняття рішень в умовах невизначеності. Наведено та проаналізовано результати комп’ютерного моделювання процесу прийняття рішень у клітинному просторі.

1. Бурков В.Н. Теория активных систем: состояние и перспективы [Текст] / В.Н. Бурков, Д.А. Новиков. – М.: СИНТЕГ, 1999. – 128 с. 2. Wooldridge, M. An Introduction to Multiagent Systems [Текст] / M. Wooldridge. – John Wiley & Sons (Chichester, England), 2002. – 366 pp. 3. Катренко А.В. Теорія прийняття рішень / А.В. Катренко, В.В. Пасічник, В.П. Пасько. – Київ: BHV, 2009. – 450 с. 4. Трухаев Р.И. Модели принятия решений в условиях неопределенности / Р.И. Трухаев. – М.: Наука, 1981. – 257 с. 5. Растригин Л.А. Адаптация случайного поиска [Текст] / Л.А. Растригин, К.К. Рипа, Г.С. Тарасенко. – Рига: Зинатне, 1978. – 244 с. 6. Назин, А.В. Адаптивный выбор вариантов: Рекуррентные алгоритмы [Текст] / А.В. Назин, А.С. Позняк. – М.: Наука, 1986. – 288 с. 7. Weiss G. Adaptation and Learning in Multiagent Systems [Текст] / Gerhard Weiss, Sandip Sen, editors. – Berlin: Springer Verlag, 1996. – 585 pp. 8. Stone, P. Layered Learning in Multiagent Systems [Текст] / P. Stone. – MIT Press, 2000. – 300 pp. 9. Watkins, C.J.C.H. Q-Learning [Текст] / C.J.C.H. Watkins, P. Dayan // Machine Learning, No. 8. – Kluwer Academic Publishers, Boston. – 1992. – PP. 279–292. 10. Sutton, R. S. Reinforcement Learning: An Introduction [Текст] / Richard S. Sutton, Andrew G. Barto. – MIT Press, 1998. – 322 pp. 11. Mitchell, T.M. Machine Learning [Текст] / T.M. Mitchell. – New York: McGraw-Hill, 1997. – 414 pp. 12. Майн, Х. Марковские процессы принятия решений [Текст] / Х. Майн, С. Осаки. – М.: Наука, 1977. – 176 pp. 13. Filar, J. Competitive Markov Decision Processes [Текст] / Jerzy Filar, Koos Vrieze. – Springer-Verlag, 1997. – 393 pp. 14. Цетлин М.Л. Исследования по теории автоматов и моделированию биологических систем [Текст] / М.Л. Цетлин. – М.: Наука, 1969. – 316 с. 15. Поспелов Д.А. Вероятностные автоматы [Текст] / Д.А. Поспелов. – М: Энергия, 1970. – 88 c. 16. Варшавский В.И. Коллективное поведение автоматов [Текст] / В.И. Варшавский. – М.: Наука, 1973. – 408 с. 17. Puterman, M. L. Markov Decision Processes: Discrete Stochastic Dynamic Programming [Текст] / M. L. Puterman. – John Wiley & Sons, New York, 2005. – 649 pp. 18. Fudenberg, D. The Theory of Learning in Games [Текст] / D. Fudenberg, D. K. Levine. – Cambridge, MA: MIT Press, 1998. – 276 pp. 19. Кормен Томас Х. Алгоритмы: построение и анализ. – 2-е изд. [Текст] / Томас Х. Кормен и др. – М.: Вильямс, 2006. – 1296 с. 20. Вазан М. Стохастическая аппроксимация [Текст] / М. Вазан. – М.: Мир, 1972. – 295 с.