Алгоритм ФорЭл
Материал из MachineLearning.
FOREL (Формальный Элемент) - алгоритм кластеризации, основанный на идее объединения в один кластер объектов в областях их наибольшего сгущения.
Необходимые условия работы
- Выполнение принципа сходства
 
Это означает, что близкие друг к дургу объекты с большой вероятностью принадлежат к одному кластеру (таксону).
- Наличие линейного или метрического пространства кластеризуемых объектов
 
Входные данные
- Параметр R - радиус поиска локальных сгущений
 
Его можно задавать как из априорных соображений (знание о диаметре кластеров), так и настраивать скользящим контролем.
- В модификациях возможно введение параметра k - количества кластеров
 
Принцип работы
- Случайно выбираем объект из выборки
 - Помечаем объекты находящиеся на расстоянии менее, чем R от текущего
 - Вычисляем их центр тяжести, помечаем этот центр как новый текущий объект
 - Повторяем пока новый текущий объект не совпадет с прежним
 - Помечаем объекты внутри сферы радиуса R вокруг текущего объекта как кластеризованные, выкидываем их из выборки
 
|   |  Данная статья является непроверенным учебным заданием.
 До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе.  | 

