Применение технологии MapReduce Hadoop для кластеризации больших объемов данных. Application of MapReduce Hadoop technology for clustering large amounts of data.

Авторлар

  • М. Е. Мансурова Әл-Фараби атындағы Қазақ ұлттық университеті image/svg+xml
  • С. Е. Шоманов Әл-Фараби атындағы Қазақ ұлттық университеті image/svg+xml
  • Б. Н. Тулепбергенов Әл-Фараби атындағы Қазақ ұлттық университеті image/svg+xml
  • С. С, Исахов Әл-Фараби атындағы Қазақ ұлттық университеті image/svg+xml
  • Е. А. Дадыкина Әл-Фараби атындағы Қазақ ұлттық университеті image/svg+xml

Кілт сөздер:

MapReduce, Hadoop, алгоритм кластеризации, параллельные вычисления, MPI, clustering algorithm, parallel computing.

Аңдатпа

Целью данной работы является реализация параллельного алгоритма ISODATA для кластеризации гиперспектральных изображений. В данном исследовании параллельный алгоритм кластеризации построен на модели программирования MapReduce. Алгоритм реализован на платформе Hadoop, которая является инфраструктурой с открытым исходным кодом, предназначенной для создания и выполнения распределенных приложений, обрабатывающих большие объемы данных. Результаты исследований сравниваются с результатами, полученными с разными параметрами кластера и MPI модели. The goal of this study is the implementation of parallel ISODATA algorithm for clustering of hyperspectral images. In this study parallel ISODATA clustering algorithm is based on MapReduce programming model. The algorithm is implemented on the platform Hadoop, which is a framework of open source software designed to create and run distributed applications that process large amounts of data. Research results are compared with the results with different cluster settings and MPI model.

Жүктеулер

Журналдың саны

Бөлім

Mechanics, Mathematics, Computer Science