Проектирование и разработка высокопроизводительных приложений на мобильных платформах. Design and development of high-performance applications on mobile platforms.

Authors

  • Б. С. Дарибаев Казахский Национальный Университет имени аль-Фараби
  • Н. Т. Данаев Казахский Национальный Университет имени аль-Фараби
  • Д. Ж. Ахмед-Заки Казахский Национальный Университет имени аль-Фараби
  • Т. С. Иманкулов Казахский Национальный Университет имени аль-Фараби
  • О. Н. Турар Казахский Национальный Университет имени аль-Фараби

Keywords:

CUDA, разделяемая память, глобальная память, мобильное устройство, высокопроизводительные приложения, параллельные вычисления, shared memory, global memory, mobile devices, high-performance applications, parallel computing.

Abstract

В данной статье рассмотрена параллельная реализация метода Якоби для решения двумерного и трјхмерного уравнений Пуассона на мобильных платформах с использованием технологии CUDA. Использование мобильных технологий для расчетов обусловлено возрастанием их вычислительных возможностей и удобством использования для небольших задач в условиях отсутствия доступа к обычным вычислительным мощностям. Проанализированы методы распределения узлов сетки на каждом блоке для повышения эффективности алгоритма. Результаты были протестированы на мобильном устройстве Xiaomi MiPad с процессором Nvidia Tegra K1 и на стационарном устройстве с видеокартой NVIDIA GeForce GTX 550Ti. Nvidia Tegra K1 - первый мобильный процессор, который поддерживает технологию CUDA, основанный на архитектуре Kepler. Приведены сравнения результатов параллельного и последовательного кода программы на стационарных и соответственно на мобильных устройствах. This article describes a parallel implementation of Jacobi's method for solving the two-dimensional and three-dimensional Poisson equation on mobile platforms using the CUDA technology. The use of mobile technology for calculations motivated by increasing of computing capabilities and ease of use for small tasks in the absence of access to conventional computing capacities. Methods of grid nodes distribution on each block to improve eciency of the algorithm were analyzed. The results were tested on a mobile device Xiaomi MiPad with Nvidia Tegra K1 processor and on a stationary device with a NVIDIA GeForce GTX 550Ti video card. Nvidia Tegra K1 - the rst mobile processor that supports technology CUDA, - based on the Kepler architecture. Comparisons of results of parallel and serial program codes, on stationary and mobile devices, were provided.

References

[1] А.А. Самарский Теория разностных схем. М.: Наука, 1977. 653 c.

[2] Jason Sanders, Edward Kandrot CUDA by Example: An Introduction to General-Purpose GPU Programming. 2010.312 p.

[3] Иноземцева Н.Г., Перепёлкин Е.Е., Садовников Б.И. Оптимизация алгоритмов задач математической физики для графических процессоров. 2012. 240 c.

[4] Shane Cook CUDA Programming: A Developer's Guide to Parallel Computing with GPUs // Applications of Gpu Computing. 2012. 600 p.

[5] Nicholas Wilt CUDA Handbook: A Comprehensive Guide to GPU Programming // The Paperback. 2013. 528 p.

Downloads

Issue

Section

Mechanics, Mathematics, Computer Science