Параллелизация сканирования генов на кластерной платформе: программа MirTarget. Parallelization of scanning genes on the cluster platform: MirTarget program.

Authors

  • А. Ю. Пыркова Казахский Национальный Университет имени аль-Фараби
  • А. Т. Иванщенко Казахский Национальный Университет имени аль-Фараби
  • О. А. Берилло Казахский Национальный Университет имени аль-Фараби

Keywords:

miRNA и mRNA, алгоритм, Java MPI, кластерная платформа, распараллеленный алгоритм, сканирование, комплементарность, miRNA and mRNA, algorithm, the cluster platform, the parallelized algorithm, scanning, complementarity.

Abstract

В настоящее время в геноме человека известно более 2500 miRNA, необходимо для каждой miRNA найти гены мишени среди 30 тысяч генов человека. Большой объём вычислений требует создания программы, позволяющей обрабатывать эти огромные массивы данных. В представленной статье предложено решение задачи сканирования генов с целью предсказания сайтов связывания miRNA с матричной РНК (mRNA). Разработанная программа была использована для проведения исследований при поиске сайтов связывания miRNA с матричной РНК (mRNA). В ходе проведённого исследования авторами были получены следующие результаты: • разработан и проанализирован алгоритм сканирования генов с miRNA с учётом одного разрыва в miRNA и максимальной (в процентном соотношении) свободной энергии при совпадении miRNA и участка гена на основе свойств комплементарности; • построенный алгоритм сканирования генов с miRNA распараллелен на кластерной платформе с использованием средств MPJ (Java MPI); • проведена оценка эффективности работы распараллеленного алгоритма на кластерной платформе с последовательным алгоритмом при обработке больших объёмов данных. Today in the human genome of the person more than 2500 miRNA are known, it is necessary for each miRNA to nd target genes among 30 thousands genes of the human. Large amount of calculations demands creation of the program, allowing processing these huge data les. In presented article the solution of the problem of gene scanning for the purpose of prediction of sites of binding of miRNA with matrix RNA (mRNA) is proposed. The developed program was used for performing researches by search of sites of binding of miRNA from matrix RNA (mRNA). During the conducted research by authors the following results were received: • the algorithm of scanning of genes with miRNA with a glance one gap in miRNA and maximum (in a percentage ratio) free energy is developed and analysed at coincidence of miRNA and a gene site on the basis of complementarity properties; • the constructed algorithm of scanning of genes with miRNA is parallelized on the cluster platform with use of MPJ tools (Java MPI); • the assessment of overall performance of the parallelized algorithm on the cluster platform with consecutive algorithm is performed when processing large volumes of data.

References

[1] Lesk Arthur M. Introduction to Bioinformatics. - Oxford: Oxford University Press, 2002. - 255 p.

[2] Jones Neil C., Pevzner Pavel A. An Introduction to Bioinformatics Algorithms. - Massachusetts: Massachusetts Institute of Technology Press, 2004. - 435 p.

[3] Jonathan M. Keith Methods in Molecular Biology. Bioinformatics: in 2 vols. - New York: Humana Press, 2008. - V. 2. -502 p.

[4] Bioinformatics and Biological Computing [Electronic resource]. - 2012. - URL: http //bip.weizmann.ac.il/toolbox/overview/software_avail.html

[5] Guckian K.M, Schweitzer B.A, Ren RXF, Sheils C.J, Paris P.L, et al Experimental measurement of aromatic stacking in the contex to duplex DNA. // J.Am.Chem.Soc. - 1996. - 118: 818283.

[6] Turner D.H, Sugimoto N, Kierzek R, Dreiker S.D. Free energy increments for hydrogen-bonds in nucleic acid base pairs. // J. Am. Chem. Soc. - 1987. - 109: 378385.

[7] Sugimoto N, Kierzek R, Turner D.H. Sequence dependence for the energetics of dangling ends and terminal base pairs in ribonucleic acid. // Biochemistry. - 1987. - 14: 455458.

[8] Boland T., Ratner B.D. Direct measurement of hydrogen bonding in DNA nucleotide bases by atomic force microscopy. // Proc. Natl. Acad. Sci. USA. - 1995. - V. 92. - Pp. 5297-5301.

[9] Kool E.T. Hydrogen bonding, base stacking, and steric eects in DNA replication. // Annu. Rev. Biophys. Biomol. Struct. - 2001. - 30: 122.

[10] Leontis N.B., Stombaugh J., Westhof E. The non-WatsonCrick base pairs and their associated isostericity matrices. // Nucleic Acids Res. - 2002. - 30(16): 34973531.

[11] Richard A. Friedman, Honig B.A. Free Energy Analysis of Nucleic Acid Base Stacking in Aqueous Solution. // Biophysical Journal. - 1995. - V. 69. - Pp. 1528-1535.

Downloads

Issue

Section

Mechanics, Mathematics, Computer Science