Самоорганізація стратегій у грі переміщення агентів

2021;
: сс. 131 - 141
1
Національний університет «Львівська політехніка»

Розроблено стохастичну ігрову модель самоорганізації стратегій стохастичної гри мобільних агентів у вигляді циклічних поведінкових патернів, які складаються із узгоджених стратегій переміщення агентів у обмеженому дискретному просторі. Поведінковий патерн багатоагентної системи є візуалізованою формою впорядкованого пере- міщення агентів, яка виникає із їх початкового хаотичного руху в ході навчання стохастичної гри.

Мобільність агентів багатокрокової стохастичної гри забезпечено тим, що у дискретні моменти часу вони випадково, одночасно і незалежно вибирають власну чисту стратегію переміщення в одному із можливих напрямків.

Поточні платежі гравців визначено як функції програшів, залежні від стратегій сусідніх гравців. Ці функції сформовано зі штрафу за нерівномірність розміщення агентів у обмеженому дискретному просторі та штрафу за зіткнення під час переміщення агентів. Випадковий вибір чистих стратегії гравців спрямовано на мінімізацію їхніх функцій середніх програшів. Генерування послідовностей чистих стратегій виконано за дискрет- ним розподілом, побудованим на основі векторів змішаних стратегій. Елементи векторів змішаних стратегій є умовними імовірностями вибору відповідних чистих стратегій переміщення. Змішані стратегії змінюються у часі, адаптивно враховуючи значення по- точних програшів. Цим забезпечено зростання імовірностей вибору тих чистих стратегій, які приводять до зменшення функцій середніх програшів.

Динаміку векторів змішаних стратегій визначено за марковським рекурентним методом, для побудови якого виконано стохастичну апроксимацію модифікованої умови доповняльної нежорсткості, яка справедлива у точках рівноваги за Нешем, та застосо- вано оператор проєктування на розширюваний одиничний епсилон-симплекс. Збіжність рекурентного ігрового методу забезпечено дотриманням фундаментальних умов та обмежень стохастичної апроксимації.

Стохастична гра розпочинається із ненавчених змішаних стратегій, які задають хаотичну картину переміщення агентів. У ході навчання стохастичної гри вектори змішаних стратегій цілеспрямовано змінюються так, щоб забезпечити впорядковане безконфлікне переміщення агентів.

У результаті комп’ютерного моделювання стохастичної гри отримано циклічні патерни самоорганізації мобільних агентів на поверхні дискретного тора та у межах прямокутної області на площині. Достовірність експериментальних досліджень підтверджено подібністю отриманих патернів переміщення агентів для різних послідовностей випадкових величин.

Результати дослідження запропоновано використати на практиці для побудови розподілених систем із елементами самоорганізації, розв’язування різноманітних потокових і транспортних задач та колективного прийняття рішень в умовах невизначеності.

  1. Gamazine, S., Deneubourg, J.-L., Frank, N.R., Sneyd, J., Theraula, G., Bonabeau, E. (2020). Self-Organization in Biological Systems. Princeton University Press.
  2. Guillot, A., Meyer, J.-A. (2013). Bionics. When the Science Imitates the Nature (in russian). Moscow: Technosphere.
  3. Zhang, W.J. (editor). (2013). Self-organization: Theories and Methods. USA: Nova Science Publishers.
  4. Kravets, P.A., Jurinets R.V, Kis, Y.P. (2020). Patterns of self-organizing strategies in the game of mobile agents (in ukrainian). Bulletin of «Lviv polytechnic national university». Series: «Information systems and networks», Issue 7, 24 - 34. DOI: 10.23939/sisn2020.07.024. phttps://doi.org/10.23939/sisn2020.07.024
  5. Kelso, J.A., Scott. (1995). Dynamic patterns: The self-organization of brain and behavior. Cambridge, MA: The Mit Press.
  6. Josselyn, S.A., Tonegawa, S. (2020). Memory engrams: Recalling imagining the future. Review. Science. American Association for the Advancement of Science (AAAS), 367, 6473, 1 - 14. DOI: 10.1126/science.aaw4325. phttps://doi.org/10.1126/science.aaw4325
  7. Samoilov, V., Bigdaj, Е. (2020). Human physiology for technical specialities: the central nervous and sensory systems. The manual for high schools. The second edition (in russian). Мoscow: Urait.
  8. Galkin, A.Yu., Titova, L.A. (2018). Fundamentals of evolutionary theory. Tutorial (in ukrainian). Kyiv: Igor Sikorsky Kyiv Polytechnic Institute.
  9. Adamatzky, A., Komosinski, M. (Eds). (2005). Artificial Life Model in Software. Springer. https://doi.org/10.1007/1-84628-214-4
  10. Adami, C. (1998). Introduction to Artificial Life. Springer. phttps://doi.org/10.1007/978-1-4612-1650-6
  11. Langton, C.G. (1995). Artificial Life. An Overview. Cambridge: The MIT Press. https://doi.org/10.7551/mitpress/1427.001.0001
  12. Sadhu, A.K., Konar, A. (2020). Multi-Agent Coordination. Wiley-IEEE Press. https://doi.org/10.1002/9781119699057
  13. Sun, Z. (2018). Cooperative Coordination and Formation Control for Multi-agent Systems. Springer. https://doi.org/10.1007/978-3-319-74265-6
  14. Yang, S., Xu, J.-X., Li, X., Shen, D. (2017). Iterative Learning Control for Multi-agent Systems Coordination. John Wiley & Sons. phttps://doi.org/10.1002/9781119189053
  15. Kravets, P. A. (2015). Game model of self-organizing of multiagent systems (in ukrainian). Bulletin of «Lviv polytechnic national university». Series: «Information systems and networks», 829, 161 - 176.
  16. Chen, B.-S. (2020). Stochastic Game Strategies and their Applications. CRC Press. https://doi.org/10.1201/9780429432941
  17. Ungureanu, V. (2018). Pareto-Nash-Stackelberg Game and Control Theory: Intelligent Paradigms and Applications. Springer. phttps://doi.org/10.1007/978-3-319-75151-1
  18. Neogy, S. K., Bapat, Ravindra, B., Dubey, Dipti. (Eds). (2018). Mathematical Programming and Game Theory. Springer. phttps://doi.org/10.1007/978-981-13-3059-9
  19. Kusuoka, S. (2020). Stochastic Analysis. Springer. phttps://doi.org/10.1007/978-981-15-8864-8
  20. Kushner, H.J., Yin, G.G. (2013). Stochastic Approximation Algorithms and Applications. Springer.
  21. Nazin, A. V., Poznyak, A. S. (1986). Adaptive Choice of Variants: Recurrence Algorithms (in russian). Moscow: Science.