Патерни самоорганізації стратегій у грі мобільних агентів

2020;
: сс. 24 - 34
1
Національний університет «Львівська політехніка»
2
Національний університет “Львівська політехніка”, кафедра інформаційних систем та мереж
3
Національний університет “Львівська політехніка”, кафедра інформаційних систем та мереж

Розглянуто актуальну проблему самоорганізації стратегій стохастичної гри багатоагентної системи. Проявом самоорганізації є формування скоординованих поведінкових патернів групи мобільних агентів, наділених здатністю переміщуватися в обмеженому дискретному просторі.

Агент – це автономний об’єкт, який може взаємодіяти із навколишнім середовищем, іншими агентами і людиною для вибору варіантів рішень. Багатоагентна система складається із групи агентів, які виконують спільну роботу, співпрацюючи між собою у межах локальних підмножин агентів. Поведінковий патерн багатоагентної системи – це візуалізована форма впорядкованого переміщення агентів, яка виникає із їх початкового хаотичного руху під час навчання стохастичної гри.

Повторювальна стохастична гра полягає у реалізації керованого випадкового процесу вибору варіантів рішень. Для цього ігрові агенти випадково, одночасно і незалежно вибирають одну із власних чистих стратегій у дискретні моменти часу. Чисті стратегії гравців визначають напрямки переміщення у двовимірному просторі: вперед, назад, направо, наліво. Після завершення вибору усіх стратегій обчислюють поточні програші гравців. Для формування впорядкованого переміщення кожен агент повинен повторювати дії сусідніх агентів. Тоді поточні програші визначаються індикаторною функцією подібності стратегій сусідніх гравців. Обчислені поточні програші використовують для адаптивного перерахунку змішаних стратегій гравців. Імовірність вибору чистої стратегії збільшується, якщо її реалізація призвела до зменшення поточного програшу. Під час повторювальної гри агенти сформують вектори змішаних стратегій, які мінімізують функції середніх програшів гравців.

Для розв'язування ігрової задачі побудови патернів самоорганізації багатоагентної системи використано адаптивний марківський рекурентний метод, побудований на основі стохастичної апроксимації модифікованої умови доповняльної нежорсткості, яка справедлива у точках рівноваги за Нешем. Для нормування елементів векторів змішаних стратегій застосовано операцію їх проектування на одиничний розширюваний епсілон-симплекс. Збіжність ігрового методу забезпечується дотриманням фундаментальних умов та обмежень стохастичної оптимізації. Комп'ютерне моделювання підтвердило можливість застосування моделі стохастичної гри для побудови патернів самоорганізації багатоагентної системи. Форма отриманих патернів залежить від способу локального орієнтування мобільних агентів. Під час комп’ютерного експерименту отримано вихрові та лінійні патерни переміщення агентів. Достовірність експериментальних досліджень підтверджується подібністю отриманих результатів для різних послідовностей випадкових величин.

Результати цієї роботи доцільно застосувати для вивчення патернів колективної поведінки агентів для глибшого розуміння процесів самоорганізації природних систем та для побудови розподілених систем прийняття рішень.

1. Гийо, А., Мейе, Ж.-А. (2013). Бионика. Когда наука имитирует природу. Москва: Техносфера.

2. Ball, Ph. (1999). The Self-Made Tapestry: Pattern Formation in Nature. Oxford: Oxford University Press.

3. Шаталкин, А. И. (2012). Таксономия. Основания, принципы и правила. Москва: Товарищество научных изданий КМК.

4. Уорвик, К. (1999). Наступление машин. Почему миром будет править новое поколение роботов. Москва: Наука / Интерпериодика.

5. Баррат, Дж. (1915). Последнее изобретение человечества: искусственній интеллект и конец эры Homo sapiens. Москва: Альпина Нон-Фикшн.

6. Кайку, М. (2017). Фізика майбутнього. Львів: Літопис.

7. Weiss, G. (2013). Multiagent Systems. Second Edition. The MIT Press.

8. Chen, B.-S. (2019). Stochastic Game Strategies and their Applications. CRC Press.

9. Кравець, П.О. (2013). Ігрова координація та самоорганізація стратегій в мультиагентній моделі „хижак-жертва”. Вісник НУ „Львівська політехніка”. Серія: „Комп’ютерні науки та інформаційні технології”, 751, 136 – 146.

10. Кравець, П.О. (2015). Ігрова модель самоорганізації мультиагентних систем. Вісник НУ „Львівська політехніка”. Серія: „Інформаційні системи та мережі”, 829, 161 – 176.

11. Kravets, P., Burov, Y., Lytvyn, V., Vysotska, V. (2019). Gaming Method of Ontology Clusterization. Webology, 16 (1), 55 – 76.

12. Иванов, Д. Я. (2016). Формирование строя в большой группе мобильных роботов с использованием метода паттернов. Робототехника и техническая кибернетика, 11 (2), 39 – 44.

13. Кучеров, Д. П., Козуб, А. М., Костина, О. М. (2017). Управління мультиагентною системою в потенціальному полі. Озброєння та військова техніка, 14 (2), 55 – 61.

14. Кузнецов, А. В. (2018). Модель движения и взаимодействия системы интеллектуальных агентов. Вестник ВГУ: Серия: Системный анализ и информационные технологии, 2, 130 – 138.

15. Коноваленко, О. Є., Брусенцев, В. О. (2019). Мультиагентні системи управління та підтримки прийняття рішень. Вісник Національного технічного університету «ХПІ». Серія: Машинознавство та САПР, 1, 18 – 27. DOI:10.20998/2079-0775.2019.1.03.

16. Ткачев, В. Н., Токарев, В. В., Чурюмов, Г. И. (2019). Разработка алгоритма мультиагентного управления группой мобильных “s-bot”. Київ: Реєстрація, зберігання і обробка даних, 21 (1), 46 – 56.

17. Ungureanu V. (2018). Pareto-Nash-Stackelberg Game and Control Theory: Intelligent Paradigms and Applications. Springer.

18. Neogy, S. K., Bapat, R. B., Dubey Dipti. (2018). Mathematical Programming and Game Theory. Springer.

19. Назин, А. В., Позняк, А. С. (1986). Адаптивный выбор вариантов: Рекуррентные алгоритмы. Москва: Наука. 20. Kushner, H., Yin, G. G. (2013). Stochastic Approximation and Recursive Algorithms and Applications. Springer Science & Business Media.