Участник:Aduenko

Материал из MachineLearning.

Перейти к: навигация, поиск

МФТИ, ФУПМ

Кафедра "Интеллектуальные системы"

Направление "Интеллектуальный анализ данных"

Mailto: aduenko1@gmail.com

Отчеты о научно-исследовательской работе

Весна 2012, 6-й семестр

Выбор признаков и шаговая логистическая регрессия для задачи кредитного скоринга

Работа посвящена выбору оптимального набора признаков для определения уровня надеж- ности заемщиков, подавших заявку на банковский кредит. Для ответа на поставленный вопрос оценивается вероятность невозврата кредита. Для отбора признаков используется шаговая регрессия, исследуется зависимость информативности отобранных признаков от параметров шаговой регрессии. В вычислительном эксперименте алгоритм тестируется на данных потребителей, подававших заявки на кредиты в определенный банк, а также на данных об отклике клиентов на маркетинговую кампанию банка.

Публикация

Осень 2012, 7-й семестр

Выбор признаков и оптимизация метрики при кластеризации коллекции документов

Исследуется проблема верификации корректности тематической классификации документов с помощью метрического алгоритма. Предложен алгоритм выбора оптимальной функции расстояния между документами. Исследуется соответствие между полученной кластеризацией документов и их экспертной классификацией. Результаты кластеризации и их соответствие экспертной тематической классификации проиллюстрированы вычислительным экспериментом на реальной коллекции документов.'

Публикация

  • А. А. Адуенко, А. А. Кузьмин, В. В. Стрижов Выбор признаков и оптимизация метрики при кластеризации коллекции документов // Известия ТулГУ.. — 2012. — № 3. — С. 119-131. — ISSN 2071-6141.

Визуализация матрицы парных расстояний между документами

В работе рассматривается алгоритм визуализации результатов тематической кластеризации коллекции документов. С помощью метода главных компонент матрица парных расстояний между документами оптимальным способом проецируется на плоскость. Предложена такая функция потерь, которая позволяет расположить название тем на плоскости с минимальным перекрытием. Алгоритм проиллюстрирован примером визуализации тезисов конференции.'

Публикация

Алгоритм оптимального расположения названий коллекции документов

В работе исследуется метод визуализации результатов тематической кластеризации коллекции документов. Матрица парных расстояний между документами оптимальным способом спроецирована на плоскость. Требуется расположить названия документов оптимальным образом. Предложена такая функция потерь, которая позволяет расположить название тем на плоскости с минимальным перекрытием. Для ее минимизации использовался алгоритм BFGS. Алгоритм проиллюстрирован примером визуализации тезисов конференции.'

Публикация

  • А. А. Адуенко, В. В. Стрижов Алгоритм оптимального расположения названий коллекции документов // Программная инженерия. — 2013. — № 3. — С. 21-25.

Весна 2013, 8-й семестр

Алгоритм построения логических правил при разметке текстов

В работе предложен метод восстановления структуры BibTeX: библиографических записей по их текстовому представлению. Структура ищется с помощью логических правил, определенных на экспертно-заданном множестве регулярных выражений. Для построения набора логических правил предполагается использовать алгоритм, основанный на тупиковых матрицах. Предложенный алгоритм проиллюстрирован задачей поиска структуры библиографических записей, представленных набором текстовых строк.'

Публикация

  • А. В. Иванова, А. А. Адуенко, В. В. Стрижов Алгоритм построения логических правил при разметке текстов // Программная инженерия. — 2013. — № 6. — С. 41-47.

Совместный выбор объектов и признаков в задачах многоклассовой классификации коллекции документов

Работа посвящена задаче ранжирования поисковой выдачи. Для решения этой задачи предложен алгоритм многоклассовой классификации с совместным отбором объектов и признаков, а также его модификация для сравнения релевантности внутри одного класса. Отбор производится двумя способами: с помощью шаговой регрессии и с помощью генетических алгоритмов. Результаты, полученные разными методами, сравниваются. Алгоритм тестируется на синтетических данных и данных поисковой выдачи Яндекса.

Публикация

  • А. А. Адуенко, В. В. Стрижов Совместный выбор объектов и признаков в задачах многоклассовой классификации коллекции документо // Инфокоммуникационные технологии. — 2013. — № 4.

О предельных движениях волчка с внутренней диссипацией в однородном поле тяжести

Рассматривается волчок, моделируемый несущим телом с неподвижной точкой и однородным шаром, помещенным в шаровую полость несущего тела такого же радиуса, как и радиус шара. Предполагается, что диссипация обеспечивается только за счет внутренних сил, возникающих при относительных перемещениях шара. Показано, что предельными движениями волчка являются только стационарные вращения вокруг вертикали. Для случая, когда центр масс волчка лежит на одной из главных осей инерции, определено все множество предельных движений и детально исследован характер их устойчивости. Установлено, что для симметричного волчка с внутренней диссипацией условие устойчивости вращений, для которых радиус-вектор центра масс волчка направлен вертикально вверх, отличается от условия Майевского.

Публикация

  • А. А. Адуенко, Н. И. Амелькин О предельных движениях волчка с внутренней диссипацией в однородном поле тяжести // Труды МФТИ. — 2013. — № 18(2). — С. 126-133.

Осень 2013, 9-й семестр

АСИМПТОТИЧЕСКИЕ СВОЙСТВА ДВИЖЕНИЙ ТЯЖЕЛОГО ВОЛЧКА С ВНУТРЕННЕЙ ДИССИПАЦИЕЙ

Рассматриваются предельные движения тяжелого волчка, моделируемо го системой твердых тел, при наличии внутреннего трения. Определено все множество предельных движений и детально исследован характер их устойчивости для случаев, когда несомое тело волчка имеет а) три и б) одну степень свободы относительно несущего тела. Результаты анализа случая а распространяются на движения волчка с жидким наполнением. Для случая б определены значения параметров, при которых волчок помимо стацио нарных вращений имеет нестационарные предельные движения, представ ляющие собой интегрируемые движения в частном случае Бобылева–Стек лова.

Публикация

  • А. А. Адуенко, Н. И. Амелькин Асимптотические свойства движений тяжелого волчка с внутренней диссипацией // Прикладная математика и механика. — 2014. — № 1.

Object selection in credit scoring using covariance matrix of parameters estimations

To construct a bank credit scoring model one must select a set of informative objects (clients) to get an unbiased estimation of the model parameters. The authors propose an object selection algorithm. It is based on analysis of the covariance matrix for the parameters estimations. The computational experiment shows statistical significance of the classification quality improvement. The algorithm is illustrated with the cash loans and heart disease data sets.'

Публикация

Generalization of the sorption process of porous materials

In this paper we present an approach for the generalization of sorption of gas in any porous framework. Our approach allows the determination of gas uptake considering only geometrical characteristics of the framework and interaction energy of the guest molecule with the framework. The derivation of this general equation for the uptake of any crystalline porous framework is presented. Based on this theory, we calculated optimal values for the adsorption enthalpy at different temperatures and pressures. We also present the use of this theory to determine the optimal linker length for a topological equivalent framework series. We validate this theoretical approach by comparing the predicted uptake to experimental values for MOF-5, MOF-14, MOF-177, MOF-200, SNU-77H and Li-metalated MOF-177 and MOF-200. We obtained the universal recipe for optimal linker length given a topology of a porous framework. We believe that these guidelines will be useful for designing new porous materials for practical molecular hydrogen storage.'

Публикация

  • Jose L. Mendoza-Cortes, Alexander A. Aduenko Generalization of the sorption process of porous materials // Phys. Rev. B. — 2014.

Весна 2014, 10-й семестр

Тематическая классификация тезисов крупной конференции с использованием экспертной модели

Работа посвящена определению тем, научных направлений и сессий тезисов крупной научной конференции. Рассматривается коллекция тезисов конференции с экспертной тематической моделью. Строится терминологический словарь конференции. Предлагается функция сходства двух тезисов. Методом неметрической иерархической кластеризации строится алгоритмическая модель конференции, с заданным весом учитывающая существующую экспертную модель. Выявляются несоответствия между экспертной моделью и предлагаемой. Алгоритм построения тематической модели проиллюстрирован кластеризацией коллекции тезисов конференции EURO 2013.'

Публикация

  • А. А. Кузьмин, А. А. Адуенко, В. В. Стрижов Тематическая классификация тезисов крупной конференции с использованием экспертной модели // Информационные технологии. — 2014. — № 6. — С. 22-26.

Object selection in credit scoring using covariance matrix of parameters estimations

Bank credit scoring models are used to estimate a default probability using a loan questionary in application form. To construct a bank credit scoring model one must select a set of informative objects (clients) to get an unbiased estimation of the model parameters. The authors propose an object selection algorithm. It is based on analysis of the covariance matrix for the parameters estimations. We introduce the specificity measure to check whether an object is an outlier. For common practical case of ill- conditioned covariance matrix the empirical specificity is suggested. The algorithm is illustrated with four benchmark datasets from machine learning repository UCI: the german cash loans data set, heart disease data set, wine quality data set and yeast data set. The computational experiment shows statistical significance of the classification quality improvement for all considered data sets. The method is compared to three other widely-used methods of outliers detection: deviance, Pearson and bayessian residuals on four benchmark datasets from machine learning repository UCI and synthetic data sets having clustered and non-clustered outliers. Suggested method performs generally better for both clustered and non-clustered outliers. The method shows acceptable outliers discrimination for data sets having up to 30--40\% of outliers.

Публикация

  • Alexander A. Aduenko, Vadim V. Strijov Object selection in credit scoring using covariance matrix of parameters estimations // Machine Learning. — 2014.


Участие в конференциях

  • 55я Конференция МФТИ, доклад "Динамика волчка с частичной внутренней диссипацией".
  • 56я Конференция МФТИ, доклад "О резонансных движениях маятника с вибрирующей точкой подвеса".
  • 20th Conference of the International Federation of Operational Research Societies. August 13-18. Barcelona, Spain. Multimodelling and Object Selection for Banking Credit Scoring.
Личные инструменты