Проблемы качества перевода систем машинного перевода для казахского языка
DOI:
https://doi.org/10.26577/JMMCS.2021.v111.i3.11Ключевые слова:
Машинный перевод, системы машинного перевода, RBMT, SMT, NMT, казахский язык, качество переводаАннотация
Казахский язык относится к языкам со сложной морфологией и синтаксисом. Сегодня большинство систем машинного перевода также рассматривают казахский язык, например Google, Яндекс, Prompt и т. д. В данной статье описаны ошибки, недостатки и проблемы машинного перевода (МП) на казахский язык. Для анализа ошибок в машинном переводе на казахский язык были отобраны наиболее популярные программы электронного перевода. При переводе с русского и английского языков на казахский (и наоборот) могут возникать различные ошибки, так как казахский язык отличается от других языков и имеет особые характеристики. Для сравнения результатов был использован эмпирический метод, а именно мониторинг и тестирование результатов перевода систем машинного перевода. С учетом результатов статистических методов были также проанализированы методы, основанные на правилах, и методы, основанные на нейронных сетях, в машинных переводах. Практическая значимость исследования заключается в разработке рекомендаций по выявлению и устранению ошибок при редактировании результатов МП. Научная значимость исследования заключается в том, что впервые систематизированы ошибки и неточности, возникающие при машинном переводе казахского языка. Также представлена оценка качества МП. Исследование, проведенное в этой статье, будет использовано для решения проблемы постредактирования в машинном переводе.
