Підходи до програмування прискорювачів обчислень

2015;
: сс. 37 - 47
Authors: 

Мельник А. О., Козак Н. Б.

Національний університет “Львівська політехніка”, кафедра електронних обчислювальних машин

Розглянуто проблему програмування прискорювачів обчислень, виділено шість підходів до їх програмування. Визначено підхід анотування фрагментів коду програми без інформації про трансформацію як найперспективніший для подальшого розвитку. Показано напрям розвитку цього підходу на основі автоматизації розпаралелення фрагментів коду.

1. Аллен Дж. Архитектура процессоров для цифровой обработки сигналов // ТИИЭР. – 1986. – Т. 73. – № 5. – С. 3–37. 2. Параллельная обработка информации. Параллельные методы и средства распознавания образов. – К.: Наукова думка, 1985. – Т. 2. – 279 с. 3. David Tarditi, Sidd Puri, and Jose Oglesby. Accelerator: simplified programming of graphics-processing units for general-purpose uses via dataparallelism. Technical Report MSR-TR-2004-184, Microsoft Corporation, December 2005. 4. NVIDIA Fermi Compute Architecture Whitepaper [Електронний ресурс] / NVIDIA. – Режим доступу: http://www.nvidia.com/content/PDF/fermi_white_papers/NVIDIA_Fermi_Comput... per.pdf. 5. AMD HD 6900 Series Instruction Set Architecture [Електронний ресурс] / AMD. – Режим доступу: http://developer.amd.com/sdks/amdappsdk/assets/AMD_HD_6900_Series_Instru... Set_Architecture.pdf. 6. Learn about the Intel Threading Building Blocks library [Електронний ресурс] / Intel. – Режим доступу: https://www.threadingbuildingblocks.org/intel-tbb-tutorial. 7. Thrust [Електронний ресурс] / NVIDIA. – Режим доступу: http://docs.nvidia.com/cuda/thrust/. 8. Bolt C++ Template Library [Електронний ресурс] / AMD. – Режим доступу: http://developer.amd.com/toolsand-sdks/opencl-zone/bolt-c-template-library. 9. C++ Accelerated Massive Parallelism [Електронний ресурс] / Microsoft. – Режим доступу: https://msdn.microsoft.com/ru-ru/library/hh265137. 10. clBLAS Compute Libraries [Електронний ресурс] / AMD. – Режим доступу: http://developer.amd.com/toolsLviv Polytechnic National University Institutional Repository http://ena.lp.edu.ua 73 and-sdks/opencl-zone/acl-amd-compute-libraries/amd-accelerated-parallel-processing-math-libraries/# clBLAS. 11. clFFT Compute Libraries [Електронний ресурс] / AMD. – Режим доступу: http://developer.amd.com/tools-and-sdks/opencl-zone/acl-amd-compute-libr.... 12. cuBLAS [Електронний ресурс] / AMD. – Режим доступу: http://docs.nvidia.com/cuda/cublas. 13. cuSPARCE [Електронний ресурс] / NVIDIA. – Режим доступу: http://docs.nvidia.com/cuda/cusparce. 14. cuFFT [Електронний ресурс] / NVIDIA. – Режим доступу: http://docs.nvidia.com/cuda/cufft. 15. cuRAND [Електронний ресурс] / NVIDIA. – Режим доступу: http://docs.nvidia.com/cuda/curand. 16. Мельник В. А. Самоконфігуровні апаратні прискорювачі обчислень в комп’ютерах / В. А. Мельник, З. Т. Сарайрех // Вісник Національного університету „Львівська політехніка” “Комп’ютерні системи та мережі”. – 2010. – № 688. – С. 163–171. 17. Козак Н. Реалізація паралельних обчислень в графічних прискорювачах [Текст] / Н. Козак // Conference ACSN-2011. – Львів, 2011. – С. 47–49. 18. Мельник А. Врахування особливостей графічного процесора в процесі створення засобів автоматичного розпаралелення програм / А. О. Мельник, Н. Б. Козак // Комп'ютерні науки та інформаційні технології: Вісник Національного університету “Львівська політехніка”. – 2013. – № 751. – С. 3–8. 19. Архитектура Intel® Many Integrated Core – расширенные возможности [Електронний ресурс] / Intel. – Режим доступу: http://www.intel.ru/content/www/ru/ru/architecture-and-technology/many-i.... 20. The LLVM Compiler Infrastructure [Електронний ресурс] / LLVM Developer Group. – Режим доступу: http://llvm.org/docs/. 21. Open64 [Електронний ресурс] / Silicon Graphics, Inc., Institute of Computing Technology, Chinese Academy of Sciences, Hewlett Packard, University of Delaware. – Режим доступу: http://sourceforge.net/projects/open64/. 22. Jungwon Kim. SnuCL: an OpenCL Framework for Heterogeneous CPU/GPU Clusters / Jungwon Kim, Sangmin Seo, Jun Lee, Jeongho Nah, Gangwon Jo, Jaejin Lee. // In ICS ’12: Proceedings of the 26th International Conference on Supercomputing. – P. 341–352, San Servolo Island, Venice, Italy, Jun. 2012. 23. PGI Accelerator Programming Model for Fortran & C [Електронний ресурс] / PGI. – Режим доступу: http://www.pgroup.com/lit/whitepapers/pgi_accel_prog_model_1.3.pdf. 24. CAPS OpenACC Compiler [Електронний ресурс] / CAPS. – Режим доступу: http://www.caps-entreprise.com/wpcontent/uploads/2012/07/CAPS_PROD_EN_op.... 25. The OpenACC Application Programming Interface [Електронний ресурс] / CRAY, CAPS, PGI, NVIDIA. – Режим доступу: http://www.openacc.org/sites/default/files/OpenACC.1.0_0.pdf.