AN ALGORITHM FOR CREATING A SEMI-SYNTHETIC DATASET FOR DIABETES

Ахрам Нишанов; Фарход Менгтураев; Файзулла Олламберганов; Уктамжон Аллаяров; Малика Хасанова; Гулшан Дониёрова

doi:10.26577/JMMCS1291202610

Авторы

Ахрам Нишанов Ташкентский университет информационных технологий имени Мухаммада аль-Хорезми, Ташкент, Узбекистан https://orcid.org/0000-0002-5652-8977
Фарход Менгтураев Денауский институт предпринимательства и педагогики, Денау, Узбекистан https://orcid.org/0000-0003-0562-8377
Файзулла Олламберганов Ташкентский университет информационных технологий имени Мухаммада аль-Хорезми, Ташкент, Узбекистан https://orcid.org/0000-0001-6450-0467
Уктамжон Аллаяров Термезский филиал Ташкентской медицинской академии, Термез, Узбекистан https://orcid.org/0009-0003-4748-6853
Малика Хасанова Ташкентская медицинская академия, Ташкент, Узбекистан https://orcid.org/0000-0002-3128-9367
Гулшан Дониёрова Денауский институт предпринимательства и педагогики, Денау, Узбекистан https://orcid.org/0009-0004-1826-524X

DOI:

https://doi.org/10.26577/JMMCS1291202610

23 12

Ключевые слова:

прогнозирование диабета, полусинтетический набор данных, аугментация данных, алгоритмы машинного обучения, синтетические медицинские данные, генеративная модель, сходство объектов

Аннотация

Последние достижения в области искусственного интеллекта и машинного обучения открыли новые возможности для совершенствования практики медицинской диагностики. Однако исследователи сталкиваются с трудностями в доступе к качественным наборам данных изза конфиденциальности реальных клинических данных, связанных с сахарным диабетом. Основной целью данного исследования является разработка алгоритма, предназначенного для генерации полусинтетического обучающего набора данных, направленного на повышение точности классификации сахарного диабета, в частности, диабета 1 и 2 типа. Был разработан алгоритм для генерации полусинтетических данных о диабете путем статистического анализа клинических атрибутов из реальных записей пациентов. Для улучшения генерации синтетических выборок без изменения свойств исходных данных был использован подход, основанный на сходстве и ориентированный на отношения между классами и объектами. Этот подход успешно сгенерировал примеры синтетических данных, которые сохранили присущую структуру и распределение, типичные для реальных данных пациентов. Механизм, основанный на сходстве, обеспечил релевантность созданных примеров, в то время как в исследовании была определена последовательность шагов, направленных на повышение качества синтетических наборов данных. Предложенный алгоритм создает искусственные наборы данных для классификации диабета с защитой данных пациентов. Данная методика привела к увеличению внутриклассового сходства с 76.18% до 82.93%, что, в свою очередь, повысило диагностическую точность моделей на основе искусственного интеллекта.

Биографии авторов

Ахрам Нишанов, Ташкентский университет информационных технологий имени Мухаммада аль-Хорезми, Ташкент, Узбекистан

Нишанов Ахрам Хасанович (ответственный автор) – доктор технических наук, профессор факультета программной инженерии Ташкентского университета информационных технологий имени Мухаммада Ал-Хоразми (Ташкент, Узбекистан, электронная почта:
nishanov_akram@mail.ru)

Фарход Менгтураев, Денауский институт предпринимательства и педагогики, Денау, Узбекистан

Менгтураев Фарход Зиятович – старший преподаватель кафедры информационных технологий Денауского института предпринимательства и педагогики (Денау, Узбекистан, электронная почта: f.mengtoraev@dtpi.uz)

Файзулла Олламберганов, Ташкентский университет информационных технологий имени Мухаммада аль-Хорезми, Ташкент, Узбекистан

Олламберганов Файзулла Фарход угли – докторант кафедры системного и прикладного программирования Ташкентского университета информационных технологий имени Мухаммада аль-Хорезми (Ташкент, Узбекистан, электронная почта: fayzulla0804@gmail.com)

Уктамжон Аллаяров, Термезский филиал Ташкентской медицинской академии, Термез, Узбекистан

Аллаяров Уктамжон Бекташович – кафедра пропедевтики внутренних болезней, реабилитации, этномедицины и эндокринологии Термезского филиала Ташкентской медицинской академии (Термез, Узбекистан, электронная почта: criptolione7777@gmail.com)

Малика Хасанова, Ташкентская медицинская академия, Ташкент, Узбекистан

Хасанова Малика Ахрамовна – Преподаватель-ассистент кафедры госпитальной терапии факультета No 2 Ташкентской медицинской академии (Ташкент, Узбекистан, электронная почта: malikabonuxasanova@gmail.com)

Гулшан Дониёрова, Денауский институт предпринимательства и педагогики, Денау, Узбекистан

Дониёрова Гулшан Тошмирзаевна – преподаватель кафедры информационных технологий Денауского института предпринимательства и педагогики (Денау, Узбекистан, электронная почта: gulshandoniyorova68@gmail.com)

АЛГОРИТМ ДЛЯ СОЗДАНИЯ ПОЛУСИНТЕТИЧЕСКОГО НАБОРА ДАННЫХ ПО ДИАБЕТУ

Авторы

DOI:

Ключевые слова:

Аннотация

Биографии авторов

Ахрам Нишанов, Ташкентский университет информационных технологий имени Мухаммада аль-Хорезми, Ташкент, Узбекистан

Фарход Менгтураев, Денауский институт предпринимательства и педагогики, Денау, Узбекистан

Файзулла Олламберганов, Ташкентский университет информационных технологий имени Мухаммада аль-Хорезми, Ташкент, Узбекистан

Уктамжон Аллаяров, Термезский филиал Ташкентской медицинской академии, Термез, Узбекистан

Малика Хасанова, Ташкентская медицинская академия, Ташкент, Узбекистан

Гулшан Дониёрова, Денауский институт предпринимательства и педагогики, Денау, Узбекистан

Загрузки

Как цитировать

Выпуск

Раздел

Язык

Информация

Быстрые ссылки