Преподавание машинного обучения
Материал из MachineLearning.
 (→Курсы)  | 
				|||
| Строка 1: | Строка 1: | ||
| - | Данный [[:Категория:Виртуальные семинары|виртуальный семинар]] предназначен для обсуждения методических вопросов, связанных с преподаванием машинного обучения и смежных дисциплин в российских вузах.   | + | {{TOCright}}  | 
| + | Данный [[:Категория:Виртуальные семинары|виртуальный семинар]] предназначен для обсуждения методических вопросов, связанных с преподаванием [[Машинное обучение|машинного обучения]] и смежных дисциплин в российских вузах.   | ||
| - | + | На данную страницу выносятся основные положения, результаты дискуссии и прочая хорошо структурированная информация.   | |
| - | + | Споры, как обычно, ведутся в [[Обсуждение:Преподавание машинного обучения|обсуждении]].  | |
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | ==   | + | Поскольку это семинар, на основной странице также можно высказывать личные мнения;   | 
| + | желательно сопровождать их подписью участника.   | ||
| + | |||
| + | == Машинное обучение — математический или инженерный курс? ==  | ||
| + | |||
| + | Согласно международным рекомендациям по преподаванию информатики в университетах  | ||
| + | ACM/IEEE Computing Curricula 2001  | ||
| + | [[информатика]] (computer science)  | ||
| + | подразделяется на 14 областей, одна из которых —  | ||
| + | [[интеллектуальные системы]] (intelligent systems).  | ||
| + | Эта область, в свою очередь, имеет 10 разделов, один из них —  | ||
| + | '''машинное обучение и нейронные сети''' (machine learning and neural networks).  | ||
| + | Для непрофильных специальностей этот курс считается факультативным.  | ||
| + | |||
| + | Типовые программы этого курса рассчитаны на расширение кругозора будущих IT-специалистов и, мягко говоря, поверхностны.   | ||
| + | Они ни в коей мере не рассчитаны на будущего научного работника или разработчика новых методов машинного обучения.   | ||
| + | Они лишь дают представление о том,   | ||
| + | какие задачи возникают на практике,   | ||
| + | какими методами их можно решать,   | ||
| + | в чём их основные принципы,   | ||
| + | какие существуют инструментальные средства,   | ||
| + | иногда — какие подводные камни ждут будущего BI-аналитика.   | ||
| + | Далеко не все методы освещаются.   | ||
| + | Теория вообще не рассматривается.   | ||
| + | |||
| + | '''Вопрос:''' стоит ли ориентироваться на этот международный стандарт?  | ||
| + | |||
| + | Стандарт оставляет большую свободу творчества преподавателю.   | ||
| + | Формально оставшись в рамках стандарта, можно сделать и полную профанацию, и удачный курс для инженеров, показывающий нетривиальные примеры реальных задач, процесс их решения, владение стандартным инструментарием.   | ||
| + | Заодно можно зацепить и кучу действительно глубоких вопросов, используя реальные задачи в качестве мотивации.   | ||
| + | Однако для преподавателя это на порядок сложнее.   | ||
| + | |||
| + | '''Математический курс''' нужен узкому кругу специалистов, которые предположительно будут заниматься разработкой новых методов и решением принципиально новых задач. Потребность в таких специалистах — около 5%. (''[[Участник:Vokov|К.В.Воронцов]] 22:33, 10 июля 2008 (MSD)'')  | ||
| + | |||
| + | '''Инженерный курс''' нужен широкому кругу специалистов, которые предположительно будут заниматься применением стандартных методов для решения более-менее типичных задач. Он также нужен будущим IT-руководителям, которые обязаны не только знать о возможностях современных методов анализа данных, но и уметь доносить своё понимание до лиц, принимающих решения. Потребность в таких специалистах — около 95%. Кстати, без этих 95% инженеров те 5% математиков вообще не имеют шансов найти работу по специальности. (''[[Участник:Vokov|К.В.Воронцов]] 22:33, 10 июля 2008 (MSD)'')  | ||
| + | |||
| + | Курсов машинного обучения «для инженеров» в мире очень много.   | ||
| + | Математических курсов очень мало, и они очень разные; каждый несёт на себе отпечаток конкретной школы.   | ||
| + | Обычно это курсы на кафедрах соотвествующего профиля.   | ||
| + | |||
| + | == Методика преподавания ==  | ||
| + | |||
| + | Предлагается обсуждать удачный и неудачный опыт.   | ||
| + | * насколько повышается эффективность преподавания при использовании слайдов?  | ||
| + | * используются ли наряду со слайдами раздаточные материалы?   | ||
| + | * как строятся практикумы?  | ||
| + | * какие задачи и вопросы даются для контроля знаний?  | ||
| + | |||
| + | == Некоторые удачные методические приёмы ==  | ||
| + | Предлагается пополнять коллекцию.   | ||
| + | |||
| + | * В начале курса посвятить одну лекцию описанию примеров разнообразных прикладных задач «из жизни».  (''[[Участник:Vokov|К.В.Воронцов]] 22:33, 10 июля 2008 (MSD)'')  | ||
| + | * В конце курса (например, на консультации перед экзаменом) нарисовать «карту курса», где показать взаимосвязи и сходства между различными методами.  (''[[Участник:Vokov|К.В.Воронцов]] 22:33, 10 июля 2008 (MSD)'')  | ||
| + | * Рассказав метод, в явном виде перечислить его достоинства и недостатки; затем рассказать о путях устранения недостатков.  (''[[Участник:Vokov|К.В.Воронцов]] 22:33, 10 июля 2008 (MSD)'')  | ||
| + | |||
| + | == Терминология ==  | ||
| + | Предлагается обсуждать список терминов, которые либо не понятно, как переводить на русский, либо «де факто» они уже переведены разными авторами по-разному, и необходимо приходить к единству.   | ||
| + | |||
| + | Возможно, для этого обсуждения надо завести отдельную страницу...   | ||
| + | |||
| + | * Business-intelligence — интеллектуальные бизнес-системы или бизнес-интеллект?  | ||
| + | * Data mining — [[интеллектуальный анализ данных]]  | ||
| + | * Optimal brain damage — ?  | ||
| + | * Optimal brain surgery — [[оптимальное прореживание нейронных сетей]]  | ||
| + | * Shatter coeffiсient — [[коэффициент разнообразия]]  | ||
| + | * Target function — [[целевая зависимость]] или [[восстанавливаемая зависимость]]? [[Целевая функция]] вызывает ненужные ассоциации с оптимизируемым функционалом.   | ||
| + | |||
| + | == Книги, которые можно выбрать за «скелет» курса ==  | ||
# {{П:Hastie 2001 The Elements of Statistical Learning}}  | # {{П:Hastie 2001 The Elements of Statistical Learning}}  | ||
| + | |||
| + | == Дополнительная литература ==  | ||
# {{П:Загоруйко 1999 Прикладные методы анализа данных и знаний}}  | # {{П:Загоруйко 1999 Прикладные методы анализа данных и знаний}}  | ||
# {{П:Журавлёв 2006 Распознавание}}  | # {{П:Журавлёв 2006 Распознавание}}  | ||
== Курсы ==   | == Курсы ==   | ||
| + | * [http://courses.csail.mit.edu/6.867/lectures.html Machine Learning (Fall 2007)] [http://people.csail.mit.edu/tommi Prof. Tommi Jaakkola], MIT.  | ||
| + | * [https://www.seas.upenn.edu/~cis520/schedule.html Machine Learning (Fall 2007)] Prof. Lyle Ungar, University of Pennsylvania - School of Engineering & Applied Science.  | ||
* [[Машинное обучение (курс лекций, К.В.Воронцов)]]  | * [[Машинное обучение (курс лекций, К.В.Воронцов)]]  | ||
* [[Машинное обучение (курс лекций, Н.Ю.Золотых)]]  | * [[Машинное обучение (курс лекций, Н.Ю.Золотых)]]  | ||
* [[Прикладная регрессия и оптимизация (курс лекций, B.В.Стрижов)]]  | * [[Прикладная регрессия и оптимизация (курс лекций, B.В.Стрижов)]]  | ||
| + | |||
{{stub}}  | {{stub}}  | ||
| + | |||
[[Категория:Виртуальные семинары]]  | [[Категория:Виртуальные семинары]]  | ||
[[Категория:Учебные курсы]]  | [[Категория:Учебные курсы]]  | ||
Версия 18:33, 10 июля 2008
 
  | 
Данный виртуальный семинар предназначен для обсуждения методических вопросов, связанных с преподаванием машинного обучения и смежных дисциплин в российских вузах.
На данную страницу выносятся основные положения, результаты дискуссии и прочая хорошо структурированная информация. Споры, как обычно, ведутся в обсуждении.
Поскольку это семинар, на основной странице также можно высказывать личные мнения; желательно сопровождать их подписью участника.
Машинное обучение — математический или инженерный курс?
Согласно международным рекомендациям по преподаванию информатики в университетах ACM/IEEE Computing Curricula 2001 информатика (computer science) подразделяется на 14 областей, одна из которых — интеллектуальные системы (intelligent systems). Эта область, в свою очередь, имеет 10 разделов, один из них — машинное обучение и нейронные сети (machine learning and neural networks). Для непрофильных специальностей этот курс считается факультативным.
Типовые программы этого курса рассчитаны на расширение кругозора будущих IT-специалистов и, мягко говоря, поверхностны. Они ни в коей мере не рассчитаны на будущего научного работника или разработчика новых методов машинного обучения. Они лишь дают представление о том, какие задачи возникают на практике, какими методами их можно решать, в чём их основные принципы, какие существуют инструментальные средства, иногда — какие подводные камни ждут будущего BI-аналитика. Далеко не все методы освещаются. Теория вообще не рассматривается.
Вопрос: стоит ли ориентироваться на этот международный стандарт?
Стандарт оставляет большую свободу творчества преподавателю. Формально оставшись в рамках стандарта, можно сделать и полную профанацию, и удачный курс для инженеров, показывающий нетривиальные примеры реальных задач, процесс их решения, владение стандартным инструментарием. Заодно можно зацепить и кучу действительно глубоких вопросов, используя реальные задачи в качестве мотивации. Однако для преподавателя это на порядок сложнее.
Математический курс нужен узкому кругу специалистов, которые предположительно будут заниматься разработкой новых методов и решением принципиально новых задач. Потребность в таких специалистах — около 5%. (К.В.Воронцов 22:33, 10 июля 2008 (MSD))
Инженерный курс нужен широкому кругу специалистов, которые предположительно будут заниматься применением стандартных методов для решения более-менее типичных задач. Он также нужен будущим IT-руководителям, которые обязаны не только знать о возможностях современных методов анализа данных, но и уметь доносить своё понимание до лиц, принимающих решения. Потребность в таких специалистах — около 95%. Кстати, без этих 95% инженеров те 5% математиков вообще не имеют шансов найти работу по специальности. (К.В.Воронцов 22:33, 10 июля 2008 (MSD))
Курсов машинного обучения «для инженеров» в мире очень много. Математических курсов очень мало, и они очень разные; каждый несёт на себе отпечаток конкретной школы. Обычно это курсы на кафедрах соотвествующего профиля.
Методика преподавания
Предлагается обсуждать удачный и неудачный опыт.
- насколько повышается эффективность преподавания при использовании слайдов?
 - используются ли наряду со слайдами раздаточные материалы?
 - как строятся практикумы?
 - какие задачи и вопросы даются для контроля знаний?
 
Некоторые удачные методические приёмы
Предлагается пополнять коллекцию.
- В начале курса посвятить одну лекцию описанию примеров разнообразных прикладных задач «из жизни». (К.В.Воронцов 22:33, 10 июля 2008 (MSD))
 - В конце курса (например, на консультации перед экзаменом) нарисовать «карту курса», где показать взаимосвязи и сходства между различными методами. (К.В.Воронцов 22:33, 10 июля 2008 (MSD))
 - Рассказав метод, в явном виде перечислить его достоинства и недостатки; затем рассказать о путях устранения недостатков. (К.В.Воронцов 22:33, 10 июля 2008 (MSD))
 
Терминология
Предлагается обсуждать список терминов, которые либо не понятно, как переводить на русский, либо «де факто» они уже переведены разными авторами по-разному, и необходимо приходить к единству.
Возможно, для этого обсуждения надо завести отдельную страницу...
- Business-intelligence — интеллектуальные бизнес-системы или бизнес-интеллект?
 - Data mining — интеллектуальный анализ данных
 - Optimal brain damage — ?
 - Optimal brain surgery — оптимальное прореживание нейронных сетей
 - Shatter coeffiсient — коэффициент разнообразия
 - Target function — целевая зависимость или восстанавливаемая зависимость? Целевая функция вызывает ненужные ассоциации с оптимизируемым функционалом.
 
Книги, которые можно выбрать за «скелет» курса
- Hastie, T., Tibshirani, R., Friedman, J. The Elements of Statistical Learning, 2nd edition. — Springer, 2009. — 533 p. (подробнее)
 
Дополнительная литература
- Загоруйко Н. Г. Прикладные методы анализа данных и знаний. — Новосибирск: ИМ СО РАН, 1999. — 270 с. — ISBN 5-86134-060-9 (подробнее)
 - Журавлёв, Ю. И., Рязанов, В. В., Сенько, О. В. «Распознавание». Математические методы. Программная система. Практические применения. — М.: ФАЗИС, 2006. — 176 с. (подробнее)
 
Курсы
- Machine Learning (Fall 2007) Prof. Tommi Jaakkola, MIT.
 - Machine Learning (Fall 2007) Prof. Lyle Ungar, University of Pennsylvania - School of Engineering & Applied Science.
 - Машинное обучение (курс лекций, К.В.Воронцов)
 - Машинное обучение (курс лекций, Н.Ю.Золотых)
 - Прикладная регрессия и оптимизация (курс лекций, B.В.Стрижов)
 

