Проектирование и разработка высокопроизводительных приложений на мобильных платформах. Design and development of high-performance applications on mobile platforms.

Б. С. Дарибаев; Н. Т. Данаев; Д. Ж. Ахмед-Заки; Т. С. Иманкулов; О. Н. Турар

Authors

Б. С. Дарибаев Al-Farabi Kazakh National University
Н. Т. Данаев Al-Farabi Kazakh National University
Д. Ж. Ахмед-Заки Al-Farabi Kazakh National University
Т. С. Иманкулов Al-Farabi Kazakh National University
О. Н. Турар Al-Farabi Kazakh National University

Keywords:

CUDA, разделяемая память, глобальная память, мобильное устройство, высокопроизводительные приложения, параллельные вычисления, shared memory, global memory, mobile devices, high-performance applications, parallel computing.

Abstract

В данной статье рассмотрена параллельная реализация метода Якоби для решения двумерного и трјхмерного уравнений Пуассона на мобильных платформах с использованием технологии CUDA. Использование мобильных технологий для расчетов обусловлено возрастанием их вычислительных возможностей и удобством использования для небольших задач в условиях отсутствия доступа к обычным вычислительным мощностям. Проанализированы методы распределения узлов сетки на каждом блоке для повышения эффективности алгоритма. Результаты были протестированы на мобильном устройстве Xiaomi MiPad с процессором Nvidia Tegra K1 и на стационарном устройстве с видеокартой NVIDIA GeForce GTX 550Ti. Nvidia Tegra K1 - первый мобильный процессор, который поддерживает технологию CUDA, основанный на архитектуре Kepler. Приведены сравнения результатов параллельного и последовательного кода программы на стационарных и соответственно на мобильных устройствах. This article describes a parallel implementation of Jacobi's method for solving the two-dimensional and three-dimensional Poisson equation on mobile platforms using the CUDA technology. The use of mobile technology for calculations motivated by increasing of computing capabilities and ease of use for small tasks in the absence of access to conventional computing capacities. Methods of grid nodes distribution on each block to improve eciency of the algorithm were analyzed. The results were tested on a mobile device Xiaomi MiPad with Nvidia Tegra K1 processor and on a stationary device with a NVIDIA GeForce GTX 550Ti video card. Nvidia Tegra K1 - the rst mobile processor that supports technology CUDA, - based on the Kepler architecture. Comparisons of results of parallel and serial program codes, on stationary and mobile devices, were provided.