Модель преобразователя с одним состоянием для морфологии казахского и русского языков

Авторы

  • У. А. Тукеев Казахский национальный университет имени аль-Фараби, г. Алматы, Республика Казахстан
  • Д. Р. Рахимова Казахский национальный университет имени аль-Фараби, г. Алматы, Республика Казахстан
  • Ж. М. Жуманов Казахский национальный университет имени аль-Фараби, г. Алматы, Республика Казахстан
  • А. Ж. Картбаев Казахский национальный университет имени аль-Фараби, г. Алматы, Республика Казахстан

Ключевые слова:

двухуровневая морфология, машинный перевод, конечные автоматы, флективные языки, многозначные отображения

Аннотация

В статье представлено исследование по построению конечных автоматов с одним состоянием для анализа двухуровневой морфологии языка со сложным строением слов, а именно, прямое преобразование их окончании в грамматические характеристики. Это проблема изучена на основе казахских и русских языков, которые являются флективными и агглютинативными по своей природе. Для решения этой проблемы применены тривиальный автомат Мели с одним состоянием и многозначное отображение. Мы изучили полноту ввода конечного автомата для анализируемых языков. Определение этой полноты для морфологического анализа гарантирует принятие конечным автоматом всех слов анализируемого языка. Для агглютинативных языков проблема определения полноты множества возможных окончаний является сложной задачей. Казахский язык является агглютинативным языком со сложной морфологией для многоуровневого машинного изучения. Далее в статье мы определим полноту множества окончаний казахского языка. Предложенная технология реализована для русско-казахского машинного перевода, оценка качество перевода выполнена метрикой BLEU.

Опубликован

2018-04-01

Как цитировать

Модель преобразователя с одним состоянием для морфологии казахского и русского языков. (2018). Вестник КазНУ. Серия математика, механика, информатика, 89(2), 110-117. https://bm.kaznu.kz/index.php/kaznu/article/view/388