Моделирование ресурсоёмких задач в области биоинформатики. Биоинформатика саласындағы көпресурсты есептердi пiшiндеу.
Ключевые слова:
математическая модель, алгоритм, Java MPI, выравнивание, нуклеотидные и аминокислотные последовательности, дендограммыАннотация
В представленной статье рассмотрены задачи множественного выравнивания нуклеотидных последовательностей и построения дендограмм. В ходе проведённого исследования автором были получены следующие результаты: • разработана математическая модель множественного выравнивания нуклеотидных и аминокислотных последовательностей; • разработан и проанализирован алгоритм множественного выравнивания, построенный на основе алгоритма Нидлмана-Вунша, который был модифицирован для обработки больших массивов данных с помощью распараллеливания процесса обработки средствами MPJ (Java MPI); • разработан алгоритм построения дендограмм, представляющий собой модификацию алгоритмов UPGMA (Unweighted Pair Group Method with Arithmetic Mean) и NJ (Neighbour Joining) с возможностью распараллеливания обработки данных; • выполнена программная реализация алгоритма множественного выравнивания и построения дендограмм на языке Java с использованием средств MPI; • результаты работы программы были протестированы на данных о нуклеотидных последовательностях, предоставленных сотрудниками кафедры биотехнологии КазНУ имени аль-Фараби. Бұл мақалада нуклеотид тiзбектерiнiң көптiк теңестiруi есептерi мен дендограмма құру қарастырылған. Зерттеу жұмыстарын жүргiзу барысында автор төмендегiдей нәтижелерге қол жеткiзген: • нуклеотид тiзбектерiнiң көптiк теңестiруi мен аминқышқылды тiзбектердiң математикалық пiшiнi өңделген; • MPJ (Java MPI) құралдарымен үлкен массивтi деректердi параллельдеу көмегiмен процесстi өңдеу үшiн модификацияланған, Нидлман-Вунш алгоритмi негiзiнде құрылған, көптiк теңестiру алгоритмi өңделiп және талқыланған; • деректердi өңдеуде параллельдеу мүмкiндiгi мен UPGMA (Unweighted Pair Group Method with Arithmetic Mean) және NJ (Neighbour Joining) алгоритмдерiн модификациялауды ұсынатын, дендограмма құратын алгоритм өңделген; • МРI құралдарын қолданып Java тiлiнде дендограмма құру және көптiк теңестiру алгоритмiн программалық iске асыру орындалған; • программа жұмыстарының нәтижесi әл-Фараби атындағы ҚазұУ-нiң биотехнология кафедрасының қызметкерлерi ұсынған, нуклеотид тiзбектерi жөнiндегi деректерде тестiленген.Библиографические ссылки
[1] Lesk Arthur M. Introduction to Bioinformatics. - Oxford: Oxford University Press, 2002. - 255 p.
[2] Ройтберг М.А. Алгоритмы сравнительного анализа первичных структур биополимеров: автореферат диссертации на соискание ученой степени доктора физико-математических наук: 03.00.28. - М.: Издательство РАН, 2009. - 43 с.
[3] Jones Neil C., Pevzner Pavel A. An Introduction to Bioinformatics Algorithms. -Massachusetts: Massachusetts Institute of Technology Press, 2004. - 435 p.
[4] Пыркова А.Ю. Множественное выравнивание нуклеотидных последовательностей и построение дендограмм с использованием средств Java MPI // Материалы IХ международной научно-практической конференции "Перспективы развития информационных технологий". - Новосибирск: Издательство НГТУ, 2012. - С. 20-25.
[5] Пыркова А.Ю. Кластерный анализ больших массивов молекулярно-генетических данных с использование программного интерфейса MPJ // Материалы международной научно-практической конференции "Актуальные проблемы информатики и процессов управления". - Алматы: Институт проблем информатики и управления, 2012. C. 221-225.
[6] Jonathan M. Keith Methods in Molecular Biology. Bioinformatics: in 2 vols. - New York: Humana Press, 2008. - V. 2. - 502 p.
[7] Bioinformatics and Biological Computing [Electronic resource]. - 2012. - URL: http : ==bip:weizmann:ac:il=toolbox=overview=software_avail:html (дата обращения: 07.09.2012)
[2] Ройтберг М.А. Алгоритмы сравнительного анализа первичных структур биополимеров: автореферат диссертации на соискание ученой степени доктора физико-математических наук: 03.00.28. - М.: Издательство РАН, 2009. - 43 с.
[3] Jones Neil C., Pevzner Pavel A. An Introduction to Bioinformatics Algorithms. -Massachusetts: Massachusetts Institute of Technology Press, 2004. - 435 p.
[4] Пыркова А.Ю. Множественное выравнивание нуклеотидных последовательностей и построение дендограмм с использованием средств Java MPI // Материалы IХ международной научно-практической конференции "Перспективы развития информационных технологий". - Новосибирск: Издательство НГТУ, 2012. - С. 20-25.
[5] Пыркова А.Ю. Кластерный анализ больших массивов молекулярно-генетических данных с использование программного интерфейса MPJ // Материалы международной научно-практической конференции "Актуальные проблемы информатики и процессов управления". - Алматы: Институт проблем информатики и управления, 2012. C. 221-225.
[6] Jonathan M. Keith Methods in Molecular Biology. Bioinformatics: in 2 vols. - New York: Humana Press, 2008. - V. 2. - 502 p.
[7] Bioinformatics and Biological Computing [Electronic resource]. - 2012. - URL: http : ==bip:weizmann:ac:il=toolbox=overview=software_avail:html (дата обращения: 07.09.2012)
Загрузки
Как цитировать
Pyrkova, A. Y. (2012). Моделирование ресурсоёмких задач в области биоинформатики. Биоинформатика саласындағы көпресурсты есептердi пiшiндеу. Вестник КазНУ. Серия математика, механика, информатика, 75(4), 55–65. извлечено от https://bm.kaznu.kz/index.php/kaznu/article/view/159
Выпуск
Раздел
Вычислительная математика и математическое моделирование