Opennmt көмегiмен қазақ тiлiне постредактрлеу

Авторлар

  • D. R. Rakhimova
  • Aliya Zjigerovna Zhunussova Kaznu

DOI:

https://doi.org/10.26577/JMMCS.2022.v113.i1.12
        168 134

Кілттік сөздер:

Opennmt, нейрон машиналық аударма, түркі тілдері

Аннотация

Қазiргi әлем және бiздiң жақын болашағымыз қолданбалы интеллектуалды жүйелерге байланысты, өйткенi жаңа технологиялар күн сайын дамып келедi. Интеллектуалды жүйелердiң мiндеттерiнiң бiрi - бiр табиғи тiлден екiншiсiне машиналық (автоматтандырылған) аударманы қолданып аудару. Машиналық аударма (тiлдiк аударма) адамдарға тiлдiк айырмашылықтарға қарамастан байланыс жасауға мүмкiндiк бередi, өйткенi ол тiлдiк тосқауылды жойып, қарым-қатынас үшiн жаңа тiлдердi ашады. Машиналық аударма - бұл жаңа технология, адам дамуындағы ерекше қадам. Аударманың бұл түрi сiзге әңгiмелесушiнiң хатта не жазғанын немесе не айтқанын тез түсiну қажет болғанда көмектесе алады. Онлайн аудармашылардың жұмысы бұрын қазақшаға және керiсiнше аударылатын. Аударма қателерi анықталды, онлайн-машиналық аударма жүйесiнiң қазақ тiлiндегi жалпы артықшылықтары мен кемшiлiктерi келтiрiлдi. Қазақ тiлiне арналған өңдеуден кейiнгi машиналық аударма жүйесiн әзiрлеу моделi ұсынылған. OpenNMT (Open Neural Machine Translation) – нейрон машинасын аудару және нейрон реттiлiгiн оқытуға арналған ашық бастапқы жүйе. OpenNMT-де тiлдердi үйрену үшiн сiзге тiлдiк жұптарға параллель корпустар қажет. OpenNMT-тiң артықшылығы - ол барлық тiлдерге қолданыла алады және үлкен корпустарды басқара алады. Эксперименттiк мәлiметтер ағылшын-қазақ тiлi жұбы үшiн алынды.

Библиографиялық сілтемелер

[1] Moore R.C., "A discriminative framework for bilingual word alignment" , Proceedings of the conference on Human Language Technology and Empirical Methods in Natural Language Processing, HLT. Vancouver (2005): 81-88.
[2] Bekbulatov, E. and Kartbayev A., "A study of certain morphological structures of Kazakh and their impact on the machine translation quality" , Proceedings of the IEEE 8th International
[3] Conference on Application of Information and Communication Technologies. Astana (2014): 495-501.
[4] Nirenburg S., "Knowledge-Based Machine Translation" , Machine Translation, Springer 1 (4) (1989): 5-24.
[5] Nagao M., "A framework of a mechanical translation between Japanese and English by analogy principle" , Proceedings of the international NATO symposium on Artificial and human intelligence (1984): 173-180.
[6] Ziemski M., Junczys-Dowmunt M. and Pouliquen B., "The United Nations Parallel Corpus" , Proceedings of Language Resources and Evaluation LREC. Slovenia (2016): 3530-3534.
[7] Koehn P., "Europarl: A Parallel Corpus for Statistical Machine Translation" , Proceedings of the 10th Machine Translation Summit Phuket (2005): 79-86.
[8] Boitet C., "Bernard Vauquois’ contribution to the theory and practice of building MT systems" , Proceedings of the 6th International Conference on Natural Language Processing and Knowledge Engineering Beijing (2010): 331-334.
[9] Tomas Mikolov, Wen-tau Yih and Geoffrey Zweig, "Linguistic Regularities in Continuous Space Word Representations" , The Association for Computational Linguistics. In HLTNAACL (2013): 746-751.
[10] Nal Kalchbrenner, Phil Blunsom, "Recurrent Continuous Translation Models" , Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing, Seattle, Washington, USA (2013): 1700-1709.
[11] Mikel L. Forcado and Ramon P. Neco, "Recursive Hetero-Associative Memories for Translation" , International WorkConference on Artificial and Natural Neural Networks, IWANN’97 Lanzarote, Canary Islands, Spain (1997): 453-46

Жүктелулер

Как цитировать

Rakhimova, D. R., & Zhunussova, A. Z. (2022). Opennmt көмегiмен қазақ тiлiне постредактрлеу. Қазұу Хабаршысы. Математика, механика, информатика сериясы, 113(1). https://doi.org/10.26577/JMMCS.2022.v113.i1.12