Алгоритм кластеризации основанный на сходстве объектов
DOI:
https://doi.org/10.26577/JMMCS2024-v123-i3-4Ключевые слова:
Задача кластеризации, функция близости, степень сходства объектов, вклад объекта в класс.Аннотация
В статье рассматривается проблема кластеризации лекарственных средств. Первоначально произвольно формируются k классов и предварительно обрабатывается полученная обучающая выборка, затем оценивается сходство между объектами каждого класса на основе функции близости и критерия оценки вклада объектов в формирование собственного класса. Обычно он выражается в процентах и представляет собой степень взаимного сходства объектов каждого класса. На следующих шагах алгоритма сначала из первого класса берется один объект и путем добавления его ко всем k классам измеряется вклад этого объекта в этот класс. Объект останется в классе, внесшем наибольший вклад. Этот процесс повторяется несколько раз подряд для всех объектов класса. Процесс останавливается, когда расположение объектов не меняется и степень сходства превышает необходимый процент. В результате формируются нужные кластеры.