потоковий граф алгоритму

Оптимізація ширини потокового графа алгоритму у нейронних мережах для зменшення використання процесорних елементів на одноплатних компʼютерах

У статті представлено метод оптимізації потокового графа алгоритму глибинної нейронної мережі для зменшення кількості процесорних елементів (ПЕ), необхідних для виконання алгоритму на одноплатних комп'ютерах. Запропонований підхід ґрунтується на використанні структурної матриці для оптимізації архітектури нейронної мережі без втрати продуктивності. Дослідження показало, що завдяки зменшенню ширини графа вдалося зменшити кількість процесорних елементів з 3 до 2, зберігаючи при цьому продуктивність мережі на рівні 75% ефективності.

Виконання поданих потоковим графом алгоритмів з використанням технології GPGPU

Здійснено короткий огляд технологій виконання обчислень на графічному процесорі (GPGPU) та особливостей написання програм при їх використанні. Перевірено ефективність способу виконання поданих потоковим графом алгоритмів на прикладі алгоритму швидкого перетворення Фур’є на графічному процесорі (GPU) з підтримкою технології GPGPU. Показано перспективу цього способу як для виконання на GPU, так і на CPU.