Постредактирование для казахского языка с использованием openNMT

Авторы

  • D. R. Rakhimova
  • Aliya Zjigerovna Zhunussova Kaznu

DOI:

https://doi.org/10.26577/JMMCS.2022.v113.i1.12

Ключевые слова:

Opennmt, нейронный машинный перевод, тюркские языки

Аннотация

Современный мир и наше ближайшее будущее зависят от прикладных интеллектуальных систем, так как новые технологии развиваются с каждым днем. Одной из задач интеллектуальных систем является машинный (автоматизированный) перевод с одного естественного языка на другой. Машинный перевод (МП) позволяет людям общаться независимо от различия языков, поскольку это устраняет языковой барьер и открывает новые языки общения. Машинный перевод - это новая технология, особый шаг в развитии человека. Этот тип перевода может помочь, когда нужно быстро понять, что ваш собеседник написал или сказал в письме. Работа онлайн-переводчиков, используемых для перевода на казахский язык и обратно. Выявлены ошибки перевода, даны общие преимущества и недостатки онлайн систем машинного перевода на казахском языке. Представлена модель разработки системы постредактирования машинного перевода для казахского языка. OpenNMT (Open Neural Machine Translation) – это система с открытым исходным кодом для нейронного машинного перевода и обучения нейронной последовательности. Для обучения языки в OpenNMT нужны параллельные корпуса для языковых пар. Преимуществом OpenNMT является применение ко всем языкам и может работать с большими корпусами.В статье рассматривается обучения тюркские языки в OpenNMT. Было получено экспериментальные данные для англо-казахского языковой пары.

Загрузки

Опубликован

2022-03-31

Как цитировать

Постредактирование для казахского языка с использованием openNMT. (2022). Вестник КазНУ. Серия математика, механика, информатика, 113(1). https://doi.org/10.26577/JMMCS.2022.v113.i1.12