паралельні обчислення

Врахування особливостей графічного процесора в процесі створення засобів автоматичного розпаралелення програм

Встановлено проблемні аспекти виконання паралельних алгоритмів на графічному прискорювачі. На основі встановлених особливостей запропоновано алгоритм генерації програм для графічного процесора.

This paper describes the main problems in implementing parallel algorithms on graphics accelerators. Based on the established features proposed algorithm generating programs for the GPU.

Паралельний алгоритм розв’язування задач теорії пружності

Для розв’язування задач теорії пружності методом декомпозиції області запро¬поновано алгоритм з використанням паралельних обчислень. Глобальна система рів¬нянь для всієї області не формується, а подається через локальні матриці та вектори для підобластей з використанням булевих матриць зв’язності. Систему лі¬нійних алгебраїч¬них рівнянь розв’язують модифікованим методом спряжених гра¬дієнтів. Розроблений алгоритм реалізований у вигладі програми мовою С++ з використанням бібліотеки паралельного виконання МРІ. Наведено результати апробації запропонованого підходу на модельному прикладі.

Метод вимірювання енергетичної ефективності обчислень на графічному ядрі

Запропоновано метод вимірювання енергетичної ефективності обчислень на CPU і GPU, який не потребує спеціалізованого вимірювального обладнання. За результатами проведених експериментів порівняно ефективність обчислень на CPU і на GPU з погляду енерговитрат.

Дослідження енергетичної ефективності графічних прискорювачів фірми NVIDI

Детально розглянуто енерговитрати під час виконання обчислень на CPU і GPU. Подано математичний апарат для обчислення питомої енергетичної ефективності й проведено експерименти, що дають змогу порівняти енергетичну ефективність CPU і GPU, а також виявити її залежність від певних параметрів програмної реалізації.

Особливості програмної реалізації розпаралелення процесу побудови дискретних динамічних моделей

Analysis of characteristics of software implementation of parallelization of process of constructing of discrete dynamical models was conducted in this paper. SIMD-architecture was used for the task of parallelization. Technology CUDA and GPU NVIDIA was used for this software implementation.