Марковский алгоритм кластеризации
Материал из MachineLearning.
| Строка 2: | Строка 2: | ||
{{Задание|Konstantinov_bionet|Nvm|31 декабря 2018}} | {{Задание|Konstantinov_bionet|Nvm|31 декабря 2018}} | ||
| - | + | ||
| - | кластеризации, основанный на моделировании потока в графе. Он был создан в 2000 году | + | == Марковский алгоритм кластеризации == |
| - | в Центре математических и компьютерных наук в Нидерландах. На сегодняшний день данный алгоритм имеет широкий спектр применений, например, для данных в | + | Марковский алгоритм кластеризации (MCL, Markov Clustering Algorithm) — быстрый и масштабируемый алгоритм кластеризации, основанный на моделировании потока в графе. Он был создан в 2000 году в Центре математических и компьютерных наук в Нидерландах. На сегодняшний день данный алгоритм имеет широкий спектр применений, например, для данных в |
молекулярной биологии. | молекулярной биологии. | ||
| + | |||
| + | |||
[[Изображение:Марковский_алгоритм_кластеризации.jpeg|thumb]] | [[Изображение:Марковский_алгоритм_кластеризации.jpeg|thumb]] | ||
| + | |||
| + | ---- | ||
| + | общее описание метода | ||
| + | |||
| + | Алгоритм основан на двух функциях expansion и inflation. | ||
| + | |||
| + | 1) expansion - разширяем поток из вершины на потенциальных участников кластера. | ||
| + | 2) inflation - уменьшаем переходы между кластерами и увеличиваем внутри кластера. | ||
| + | |||
| + | |||
| + | ---- | ||
| + | |||
| + | итог по алгоритму | ||
| + | #Плюсы алгоритма | ||
| + | ##Работает как с взвешенными, так и с невзвешенными графами | ||
| + | ##Устойчив к шуму в данных | ||
| + | ##Количество кластеров не указано заранее, но можно настроить степень детализации кластера с параметрами | ||
| + | #Минусы алгоритма | ||
| + | ##Не удается найти перекрывающиеся кластеры (*) | ||
| + | ##Не подходит для кластеров большого размера | ||
| + | ##Часто кластеры получаются разного размера | ||
| + | |||
| + | |||
| + | |||
| + | ---- | ||
Список используемой литературы | Список используемой литературы | ||
Версия 14:16, 28 октября 2018
| | Данная статья является непроверенным учебным заданием.
До указанного срока статья не должна редактироваться другими участниками проекта MachineLearning.ru. По его окончании любой участник вправе исправить данную статью по своему усмотрению и удалить данное предупреждение, выводимое с помощью шаблона {{Задание}}. См. также методические указания по использованию Ресурса MachineLearning.ru в учебном процессе. |
Марковский алгоритм кластеризации
Марковский алгоритм кластеризации (MCL, Markov Clustering Algorithm) — быстрый и масштабируемый алгоритм кластеризации, основанный на моделировании потока в графе. Он был создан в 2000 году в Центре математических и компьютерных наук в Нидерландах. На сегодняшний день данный алгоритм имеет широкий спектр применений, например, для данных в молекулярной биологии.
общее описание метода
Алгоритм основан на двух функциях expansion и inflation.
1) expansion - разширяем поток из вершины на потенциальных участников кластера. 2) inflation - уменьшаем переходы между кластерами и увеличиваем внутри кластера.
итог по алгоритму
- Плюсы алгоритма
- Работает как с взвешенными, так и с невзвешенными графами
- Устойчив к шуму в данных
- Количество кластеров не указано заранее, но можно настроить степень детализации кластера с параметрами
- Минусы алгоритма
- Не удается найти перекрывающиеся кластеры (*)
- Не подходит для кластеров большого размера
- Часто кластеры получаются разного размера
Список используемой литературы
1) Van Dongen, S. 2000. “Graph clustering by flow simulation.” Ph.D. thesis, University of Utrecht, The Netherlands
2) https://www.micans.org/mcl/index.html
3) Li, Li, Christian J. Stoeckert, and David S. Roos. "OrthoMCL: identification of ortholog groups for eukaryotic genomes." Genome research 13.9 (2003): 2178-2189.
4)Satuluri, Venu, Srinivasan Parthasarathy, and Duygu Ucar. "Markov clustering of protein interaction networks with improved balance and scalability." Proceedings of the first ACM international conference on bioinformatics and computational biology. ACM, 2010.

