Разработка единого метаязыка морфологии тюркских языков

Авторы

  • А. Sharipbay НИИ «Искусственный интеллект», Евразийский национальный университет имени Л.Н. Гумилева
  • A. Gatiatullin Институт прикладной семиотики Академии наук Республики Татарстан
  • B. Yergesh НИИ «Искусственный интеллект», Евразийский национальный университет имени Л.Н. Гумилева
  • D. Kazhymukhan НИИ «Искусственный интеллект», Евразийский национальный университет имени Л.Н.Гумилева

DOI:

https://doi.org/10.26577/JMMCS-2018-4-557

Ключевые слова:

морфология, тюркские языки, метаязык, тезаурус

Аннотация

 В настоящее время в связи с резким увеличением объема информации на естественных языках в интернете и социальных сетях исследование и разработки в области вычислительной лингвистики становятся чрезвычайно актуальными. Как известно, вычислительная лингвистика является новым научным направлением и входит в состав вычислительной науки - информатики. Вычислительная лингвистика включает в себе компьютерную обработку естественных языков (ОЕЯ) – Natural Language Proccesing (NLP). Создание унифицированной системы разметки для тюркских языков (UniTurk) является актуальной задачей для обработки тюркских языков. Единая система разметок позволит унифицировать разметки, облегчить их понимание и использовать общее программное обеспечение, а также проводить различные исследования по лингво-статистическому сравнительному анализу среди тюркских языков. В статье представлены некоторые результаты, полученные в ходе выполнения запланированных работ над международным проектом по созданию многоязычной онтологии и единого метаязыка морфологии тюркских языков. С помощью онтологических моделей формализованы морфологические правила тюркских (казахского, киргизского, татарского, турецкого и узбекского) языков. Результат этих работ могут быть использованы для решения задач NLP, например, для разметка корпусов, в системах извлечения знаний, системах информационного поиска, машинного перевода и т.д.

Биографии авторов

  • А. Sharipbay, НИИ «Искусственный интеллект», Евразийский национальный университет имени Л.Н. Гумилева

    старший преподаватель кафедры Информатики и информационной безопасности, научный сотрудник НИИ “Искусственный интеллект”

  • A. Gatiatullin, Институт прикладной семиотики Академии наук Республики Татарстан

    доктор технических наук, профессор кафедры Информатики и информационной безопасности, директор НИИ “Искусственный интеллект”

  • B. Yergesh, НИИ «Искусственный интеллект», Евразийский национальный университет имени Л.Н. Гумилева

    кандидат технических наук, заведующий отделом интеллектуальных информационных систем Института прикладной семиотики АН РТ

  • D. Kazhymukhan, НИИ «Искусственный интеллект», Евразийский национальный университет имени Л.Н.Гумилева

    магистрант специальности 5M060100-Информатика

Загрузки

Опубликован

2019-01-24

Как цитировать

Разработка единого метаязыка морфологии тюркских языков. (2019). Вестник КазНУ. Серия математика, механика, информатика, 100(4), 78=87. https://doi.org/10.26577/JMMCS-2018-4-557