Проблемы качества перевода систем машинного перевода для казахского языка

Авторы

  • A. Karibayeva Казахский национальный университет имени аль-Фараби, Казахстан, г.Алматы http://orcid.org/0000-0002-2023-1573
  • V. Karyukin Казахский национальный университет им. аль-Фараби, Казахстан, г. Алматы http://orcid.org/0000-0002-8768-0349
  • A. Turgynbayeva Казахский национальный университет им. аль-Фараби, Казахстан, г. Алматы http://orcid.org/0000-0001-9660-6928
  • A. Turarbek Казахский национальный университет им. аль-Фараби, Казахстан, г. Алматы http://orcid.org/0000-0002-4793-0446

DOI:

10.26577/JMMCS.2021.v111.i3.11

Ключевые слова:

Машинный перевод, системы машинного перевода, RBMT, SMT, NMT, казахский язык, качество перевода

Аннотация

Казахский язык относится к языкам со сложной морфологией и синтаксисом. Сегодня большинство систем машинного перевода также рассматривают казахский язык, например Google, Яндекс, Prompt и т. д. В данной статье описаны ошибки, недостатки и проблемы машинного перевода (МП) на казахский язык. Для анализа ошибок в машинном переводе на казахский язык были отобраны наиболее популярные программы электронного перевода. При переводе с русского и английского языков на казахский (и наоборот) могут возникать различные ошибки, так как казахский язык отличается от других языков и имеет особые характеристики. Для сравнения результатов был использован эмпирический метод, а именно мониторинг и тестирование результатов перевода систем машинного перевода. С учетом результатов статистических методов были также проанализированы методы, основанные на правилах, и методы, основанные на нейронных сетях, в машинных переводах. Практическая значимость исследования заключается в разработке рекомендаций по выявлению и устранению ошибок при редактировании результатов МП. Научная значимость исследования заключается в том, что впервые систематизированы ошибки и неточности, возникающие при машинном переводе казахского языка. Также представлена оценка качества МП. Исследование, проведенное в этой статье, будет использовано для решения проблемы постредактирования в машинном переводе.

Загрузки

Опубликован

2021-10-09

Как цитировать

Проблемы качества перевода систем машинного перевода для казахского языка. (2021). Вестник КазНУ. Серия математика, механика, информатика, 111(3), 132-140. https://doi.org/10.26577/JMMCS.2021.v111.i3.11