навчання з підкріпленням

Hybridizing Large Language Models and Markov Processes: a New Paradigm for Autonomous Penetration Testing

The article explores a hybrid framework for autonomous penetration testing that integrates Large Language Models (LLMs) with Markov decision processes (MDP/POMDP) and reinforcement learning (RL). Conventional penetration testing is increasingly insufficient for modern, complex cyber threats. LLMs are utilized for high-level strategic planning, generating potential attack paths, while MDP/POMDP models combined with RL execute low-level actions under uncertainty. A feedback loop allows outcomes to refine strategies in dynamic and partially observable environments.

МОДЕЛЬ УПРАВЛІННЯ КРОКУЮЧИМИ ПЛАТФОРМАМИ НА БАЗІ ШТУЧНИХ НЕЙРОННИХ МЕРЕЖ

У статті здійснено комплексне дослідження моделі управління роботизованими платформами, які крокують, зокрема гексаподами, що ґрунтується на застосуванні методів глибокого навчання з підкріпленням. Обґрунтовано актуальність використання штучних нейронних мереж для формування адаптивної поведінки роботів в умовах, заздалегідь не визначених, що дає змогу забезпечити гнучкість та стійкість їх функціонування у змінному середовищі.

Метод децентралізованого управління адаптивними процесами збору даних в автономних розподілених системах

Розглянуто проблему організації процесів збору даних в автономних розподілених системах, зокрема в автономних мобільних кіберфізичних системах та автономних розподілених системах моніторингу навколишнього середовища. Запропоновано модель децентралізованого управління адаптивними процесами збору даних на основі принципу рівноваги. За допомогою цієї моделі досліджено задачу узгодження спільних колективних дій адаптивних процесів збору даних з точки зору пошуку ефективної схеми їх взаємодоповнення за умов відсутності центру управління.