Проблемы качества перевода систем машинного перевода для казахского языка

Авторы

DOI:

https://doi.org/10.26577/JMMCS.2021.v111.i3.11

Ключевые слова:

Машинный перевод, системы машинного перевода, RBMT, SMT, NMT, казахский язык, качество перевода

Аннотация

Казахский язык относится к языкам со сложной морфологией и синтаксисом. Сегодня большинство систем машинного перевода также рассматривают казахский язык, например Google, Яндекс, Prompt и т. д. В данной статье описаны ошибки, недостатки и проблемы машинного перевода (МП) на казахский язык. Для анализа ошибок в машинном переводе на казахский язык были отобраны наиболее популярные программы электронного перевода. При переводе с русского и английского языков на казахский (и наоборот) могут возникать различные ошибки, так как казахский язык отличается от других языков и имеет особые характеристики. Для сравнения результатов был использован эмпирический метод, а именно мониторинг и тестирование результатов перевода систем машинного перевода. С учетом результатов статистических методов были также проанализированы методы, основанные на правилах, и методы, основанные на нейронных сетях, в машинных переводах. Практическая значимость исследования заключается в разработке рекомендаций по выявлению и устранению ошибок при редактировании результатов МП. Научная значимость исследования заключается в том, что впервые систематизированы ошибки и неточности, возникающие при машинном переводе казахского языка. Также представлена оценка качества МП. Исследование, проведенное в этой статье, будет использовано для решения проблемы постредактирования в машинном переводе.

Загрузки

Опубликован

2021-10-09

Как цитировать

Проблемы качества перевода систем машинного перевода для казахского языка. (2021). Вестник КазНУ. Серия математика, механика, информатика, 111(3), 132-140. https://doi.org/10.26577/JMMCS.2021.v111.i3.11