Участник:Andriygav
Материал из MachineLearning.
 (→Осень 2018, 7й семестр)  | 
				 (→Весна 2019, 8й семестр)  | 
			||
| Строка 15: | Строка 15: | ||
== Весна 2019, 8й семестр ==  | == Весна 2019, 8й семестр ==  | ||
| - | '''  | + | '''Ранее прогнозирования достаточного объема выборки'''<br/>  | 
| - | ''  | + | ''Исследуется проблема снижения затрат на сбор данных, необходимых для построения  | 
| + | адекватной модели. Рассматриваются задачи линейной и логистической моделей. Для решения этих задач требуется, чтобы выборка содержала необходимое число  объектов. Требуется предложить метод вычисления оптимального обьема данных, соблюдая при этом баланс между точностью модели и и трудозатратами при сборе данных. Предпочтительны те методы оценки объемы, которые позволяют строить адекватные модели по выборкам возможно меньшего объема. '' <br/>  | ||
== Выступления на конференциях и семинарах ==  | == Выступления на конференциях и семинарах ==  | ||
Версия 07:11, 28 мая 2019
Содержание | 
Личная информация
- Грабовой Андрей
 - МФТИ, ФУПМ
 - Интеллектуальные системы
 - Интеллектуальный анализ данных
 - E-mail: grabovoy.av@phystech.edu, andriy.graboviy@mail.ru
 
Весна 2018, 6й семестр
Автоматическое определение релевантности параметров нейросети
Работа посвящена оптимизации структуры нейронной сети. Предполагается, что число параметров нейроной сети можно существенно снизить без значимой потери качества и без значимого повышения дисперсии функции ошибки. Предлагается метод прореживания параметров нейронной сети, основанный на автоматическом определении релевантности параметров. Для определения релевантности параметров, предлагается проанализировать ковариационую матрицу апостериорного распределения параметров и удалить из нейросети наименее релевантные и мультиколлинеарные параметры. Для определения мультиколлинеарности предлагается использовать метод Белсли. Для анализа качества представленного алгоритма проводятся эксперименты на выборке Boston Housing, а также на синтетических данных. 
Осень 2018, 7й семестр
Численные методы оценки объема выборки в задачах регрессии и классификации
Исследуется проблема снижения затрат на сбор данных, необходимых для построения адекватной модели. Решаются задачи регрессии и классификации. Для решения этих задач требуется, чтобы выборка содержала необходимое число объектов и не противоречила гипотезе порождения данных.  Эта гипотеза состоит из предположений о составе выборки и свойствах модели, которая описывает ее оптимально, согласно принятому критерию. Адекватной называется модель, не противоречащая гипотезе порождения данных. Базовыми предположениями являются предположения о простоте и однородности выборки: выборка, необходимый объем которой требуется оценить, адекватно аппроксимируется одной обобщенно-линейной моделью. Предпочтительны те методы оценки объемы, которые позволяют строить адекватные модели по выборкам возможно меньшего объема. Данная работа анализирует численные свойства методов, используемых для оценки выборки на практике и предлагает пути их улучшения. В анализ включены как методы, оценивающие объем выборки исходя из гипотезы порождения данных, использующие эвристические предположения, так и методы, учитывающие структуру модели, которая будет построена. Вычислительный эксперимент включает часто используемые открытые выборки, а также синтетически сгенерированные выборки.  
Весна 2019, 8й семестр
Ранее прогнозирования достаточного объема выборки
Исследуется проблема снижения затрат на сбор данных, необходимых для построения
адекватной модели. Рассматриваются задачи линейной и логистической моделей. Для решения этих задач требуется, чтобы выборка содержала необходимое число  объектов. Требуется предложить метод вычисления оптимального обьема данных, соблюдая при этом баланс между точностью модели и и трудозатратами при сборе данных. Предпочтительны те методы оценки объемы, которые позволяют строить адекватные модели по выборкам возможно меньшего объема.  
Выступления на конференциях и семинарах
- 12 октября 2018. ИОИ-2018. Автоматическое определение релевантности параметров нейросети.
 - 29 ноября 2019. 61-я Всероссийская научная конференция МФТИ. Поиск оптимальной модели при помощи алгоритмов прореживания.
 
Публикации
- Грабовой А.В., Бахтеев О.Ю., Стрижов В.В. Определение релевантности параметров нейросети // Информатика и ее применения, 2019, 13(3).
 

