АЛГОРИТМ ДЛЯ СОЗДАНИЯ ПОЛУСИНТЕТИЧЕСКОГО НАБОРА ДАННЫХ ПО ДИАБЕТУ

Авторы

DOI:

https://doi.org/10.26577/JMMCS1291202610

Ключевые слова:

прогнозирование диабета, полусинтетический набор данных, аугментация данных, алгоритмы машинного обучения, синтетические медицинские данные, генеративная модель, сходство объектов

Аннотация

Последние достижения в области искусственного интеллекта и машинного обучения открыли новые возможности для совершенствования практики медицинской диагностики. Однако исследователи сталкиваются с трудностями в доступе к качественным наборам данных изза конфиденциальности реальных клинических данных, связанных с сахарным диабетом. Основной целью данного исследования является разработка алгоритма, предназначенного для генерации полусинтетического обучающего набора данных, направленного на повышение точности классификации сахарного диабета, в частности, диабета 1 и 2 типа. Был разработан алгоритм для генерации полусинтетических данных о диабете путем статистического анализа клинических атрибутов из реальных записей пациентов. Для улучшения генерации синтетических выборок без изменения свойств исходных данных был использован подход, основанный на сходстве и ориентированный на отношения между классами и объектами. Этот подход успешно сгенерировал примеры синтетических данных, которые сохранили присущую структуру и распределение, типичные для реальных данных пациентов. Механизм, основанный на сходстве, обеспечил релевантность созданных примеров, в то время как в исследовании была определена последовательность шагов, направленных на повышение качества синтетических наборов данных. Предложенный алгоритм создает искусственные наборы данных для классификации диабета с защитой данных пациентов. Данная методика привела к увеличению внутриклассового сходства с 76.18% до 82.93%, что, в свою очередь, повысило диагностическую точность моделей на основе искусственного интеллекта.

Биографии авторов

  • Ахрам Нишанов, Ташкентский университет информационных технологий имени Мухаммада аль-Хорезми, Ташкент, Узбекистан

    Нишанов Ахрам Хасанович (ответственный автор) – доктор технических наук, профессор факультета программной инженерии Ташкентского университета информационных технологий имени Мухаммада Ал-Хоразми (Ташкент, Узбекистан, электронная почта:
    nishanov_akram@mail.ru)

  • Фарход Менгтураев, Денауский институт предпринимательства и педагогики, Денау, Узбекистан

    Менгтураев Фарход Зиятович – старший преподаватель кафедры информационных технологий Денауского института предпринимательства и педагогики (Денау, Узбекистан, электронная почта: f.mengtoraev@dtpi.uz)

  • Файзулла Олламберганов, Ташкентский университет информационных технологий имени Мухаммада аль-Хорезми, Ташкент, Узбекистан

    Олламберганов Файзулла Фарход угли – докторант кафедры системного и прикладного программирования Ташкентского университета информационных технологий имени Мухаммада аль-Хорезми (Ташкент, Узбекистан, электронная почта: fayzulla0804@gmail.com)

  • Уктамжон Аллаяров, Термезский филиал Ташкентской медицинской академии, Термез, Узбекистан

    Аллаяров Уктамжон Бекташович – кафедра пропедевтики внутренних болезней, реабилитации, этномедицины и эндокринологии Термезского филиала Ташкентской медицинской академии (Термез, Узбекистан, электронная почта: criptolione7777@gmail.com)

  • Малика Хасанова, Ташкентская медицинская академия, Ташкент, Узбекистан

    Хасанова Малика Ахрамовна – Преподаватель-ассистент кафедры госпитальной терапии факультета No 2 Ташкентской медицинской академии (Ташкент, Узбекистан, электронная почта: malikabonuxasanova@gmail.com)

  • Гулшан Дониёрова, Денауский институт предпринимательства и педагогики, Денау, Узбекистан

    Дониёрова Гулшан Тошмирзаевна – преподаватель кафедры информационных технологий Денауского института предпринимательства и педагогики (Денау, Узбекистан, электронная почта: gulshandoniyorova68@gmail.com)

Опубликован

2026-03-19

Как цитировать

АЛГОРИТМ ДЛЯ СОЗДАНИЯ ПОЛУСИНТЕТИЧЕСКОГО НАБОРА ДАННЫХ ПО ДИАБЕТУ. (2026). Вестник КазНУ. Серия математика, механика, информатика, 129(1), 114-128. https://doi.org/10.26577/JMMCS1291202610