Қазақ тiлiне арналған машиналық аударма жүйелерiн аудару сапасы мәселелерi

Авторлар

DOI:

https://doi.org/10.26577/JMMCS.2021.v111.i3.11

Кілттік сөздер:

Машиналық аударма, машиналық аударма жүйелерi, RBMT, SMT, NMT, қазақ тiлi, аударма сапасы

Аннотация

Казақ тiлi күрделi морфологиясы мен синтаксисi бар тiлдерге жатады. Бүгiнгi таңда машиналық аударма жүйелерiнiң көпшiлiгi қазақ тiлiн, мысалы Google, Яндекс, Prompt және т.б. қолданады. Қазақ тiлiне машиналық аудармадағы (МА) қателердi анықтау үшiн ең танымал электрондық аударма бағдарламалары таңдалды. Орыс және ағылшын тiлдерiнен қазақ тiлiне (және керiсiнше) аударған кезде әртүрлi қателiктер туындауы мүмкiн, өйткенi қазақ тiлi басқа тiлдерден өзгеше және ерекше сипаттамаларға ие. Нәтижелердi салыстыру үшiн эмпирикалық әдiс қолданылды, атап айтқанда машиналық аударма жүйелерiнiң аударма нәтижелерiн бақылау және тестiлеу. Статистикалық әдiстердiң нәтижелерiн ескере отырып, ережеге негiзделген әдiстер мен машиналық аудармалардағы нейрондық желiлерге негiзделген әдiстер де талданды. Зерттеудiң практикалық маңыздылығы МА нәтижелерiн өңдеу кезiнде қателердi анықтау және жою бойынша ұсыныстар әзiрлеу болып табылады. Зерттеудiң ғылыми маңыздылығы қазақ тiлiн машиналық аудару кезiнде туындайтын қателер мен дәлсiздiктер алғаш рет жүйелендiрiлгендiгiнде. Сондай-ақ, МА сапасын бағалау ұсынылған. Осы мақалада жүргiзiлген зерттеу машиналық аудармада пост-редакциялау мәселесiн шешу үшiн қолданылады.

Библиографиялық сілтемелер

[1] Zhumanov Zh.M., Tukeyev U.A., "Development of machine translation software logical model (translation from Kazakh into English language)" , Reports of the Third Congress of the World Mathematical Society of Turkic Countries. Edited by Academician Bakhytzhan T. Zhumagulov 1 (2009): 356-363.
[2] Tukeyev U., Zhumanov Zh., Rakhimova D., "Features of development for natural language processing" , In the book "ICT - from theory to practice" edited by M. Milosz. Polish Information Processing Society, Lublin (2010): 149-174.
[3] Tukeyev U., Rakhimova D., "Augmented attribute grammar in meaning of natural languages sentences" , The 6th International Conference on Soft Computing and Intelligent Systems, and the 13th International Symposium on Advanced Intelligent Systems, SCIS-ISIS2012/Kobe, Japan (2012): 1080-1085.
[4] Tukeyev U.À., Rakhimova D.R., Baisylbayeva Ê., Umirbekov N., Orazov B., Abakhan Ì., Kyzyrkanova S.,
"Kopmagynalyk beineleu keste tasili negizinde orys tilinen kazakh tiline mashinalyk audarmasynyng morfologiyalyk analizben sintezin kuru [Synthesis of morphological analysis of machine translation from Russian to Kazakh on the basis of the method of ambiguous mapping]" , In proceedings of the I International Conference on Computer processing of Turkic Languages (2013): 182-191.
[5] Tukeyev U.À., "Razrabotka tehnologii mashinnogo perevoda na osnove metoda mnogoznachnyh otobrazhenii dlya morfologicheski slojnyh yazykov [Development of machine translation technology based on the multivalued mapping method for morphologically complex languages]" , Proceedings of the 4th International Scientic and Practical Conference "Informatization of Society" (2014): 130-132.
[6] Abeustanova A., Tukeyev U., "Automatic Post-editing of Kazakh Sentences Machine Translated from English" , In Advanced Topics in Intelligent Information and Database Systems. ACIIDS 2017. Studies in Computational Intelligence, Springer 710 (2017): 283-295.
[7] Rakhimova D.R., Turarbek À.Ò., Karyukin V., Karibayeva À., Turganbayeva À., "Kazakh tiline arnalgan zamanaui mashinalyk audarma tehnologiyalaryna sholu [Review of modern machine translation technologies for the Kazakh language]" , Bulletin of KazNRTU named after K. Satpayev. Technical science 5 (141) (2020): 103-109.
[8] Shormakova A., Zhumanov Zh., Rakhimova D., "Post-editing of words in Kazakh sentences for information retrieval" , Journal of Theoretical and Applied Information Technology 97 (6) (2019): 1896-1908.
[9] Turganbayeva A., Tukeyev U., "The solution of the problem of unknown words under neural machine translation of the Kazakh language" , Journal of Information and Telecommunication (2020): 214-225.
[10] Tukeyev U., Karibayeva A., Zhumanov Z., "Morphological segmentation method for Turkic language neural machine translation" , Cogent Engineering 7(1) (2020): 1-16.
[11] Pairaphrase, "Two Approaches for How to Improve Machine Translation Quality" , ttps://www.pairaphrase.com/howto-improve-machine-translation-quality (2020).
[12] Philipp Koehn, Rebecca Knowles, "Six Challenges for Neural Machine Translation" , Proceedings of the First Workshop on Neural Machine Translation (2017): 28-39.
[13] Philipp Koehn, Statistical Machine Translation. Draft of Chapter 13. Neural Machine Translation (arXiv:1709.07809v1 [cs.CL], 2017): 117

Жүктелулер

Жарияланды

2021-10-09