Методы анализа текстов (семинар, К.В.Воронцов)
Материал из MachineLearning.
м   | 
				м  (→Расписание (осень 2018))  | 
			||
| (38 промежуточных версий не показаны.) | |||
| Строка 1: | Строка 1: | ||
| - | + | Семинары научной группы К.В. Воронцова по анализу текстов (Natural Language Processing, NLP). Разбираем современные статьи из области NLP, работы студентов и приглашенных докладчиков.   | |
== Где и когда ==  | == Где и когда ==  | ||
| - | По средам в 19.30 в Школе Анализа Данных Яндекса (ул. Тимура Фрунзе, 11к2) в аудитории   | + | По средам в 19.30 в Школе Анализа Данных Яндекса (ул. Тимура Фрунзе, 11к2) в аудитории Гарвард. Приходить на проходную с обратной стороны Мамонтова ([https://drive.google.com/open?id=0B2cCJQ2_aOwjbWljemlzMjZDckk вот сюда]) с паспортом.  | 
| - | Проход строго по спискам  | + | Проход строго по спискам. Записаться на осенний семестр 2018 года [https://docs.google.com/spreadsheets/d/11dA2u6IaNfT4D5cAa_TkiK__-rsZtoaVS7Z8TFFCSyY/edit?usp=sharing нужно здесь].    | 
| - | + | Внимание: чтобы ваша фамилия оказалась на охране, записаться нужно не позднее вечера вторника.  | |
| - | + | ||
== Контакты и ссылки ==  | == Контакты и ссылки ==  | ||
| - | Канал в телеграме: NLP_weekly   | + | Канал в телеграме: '''NLP_weekly'''   | 
По всем вопросам: anna.a.potapenko at gmail.com  | По всем вопросам: anna.a.potapenko at gmail.com  | ||
| Строка 16: | Строка 15: | ||
https://bit.ly/2MXs5t3 — короткая ссылка на эту страницу.  | https://bit.ly/2MXs5t3 — короткая ссылка на эту страницу.  | ||
| - | https://goo.gl/rc4grq — короткая ссылка на страницу   | + | https://goo.gl/rc4grq — короткая ссылка на [[Методы анализа текстов (спецсеминары, К.В. Воронцов)/2017-2018 год|страницу 2017-2018 учебного года]].  | 
== Расписание (осень 2018) ==  | == Расписание (осень 2018) ==  | ||
| Строка 32: | Строка 31: | ||
[https://arxiv.org/abs/1801.06146 Universal Language Model Fine-tuning for Text Classification]  | [https://arxiv.org/abs/1801.06146 Universal Language Model Fine-tuning for Text Classification]  | ||
| Михаил Архипов (IPavlov)  | | Михаил Архипов (IPavlov)  | ||
| - | |   | + | | [https://drive.google.com/open?id=1-3rHHUQgIHZZSu5dvGYhjX1d36I5TVYo Презентация]  | 
|- <!-- Конец записи -->  | |- <!-- Конец записи -->  | ||
|- <!-- Новая запись -->  | |- <!-- Новая запись -->  | ||
|-  | |-  | ||
| 19 сентября  | | 19 сентября  | ||
| - | |   | + | | 1. Order-embeddings and [http://hyperbolicdeeplearning.com/?p=38 hyperbolic deep learning]  | 
| - | [https://ronan.collobert.com/pub/matos/2008_nlp_icml.pdf   | + | 2. Multitask learning in NLP: from 2008 to 2018  | 
| - | + | | 1. Роман Дербаносов  | |
| - | + | 2. Татьяна Савельева (Яндекс)  | |
| + | |  1. Hyperbolic embeddings. [https://drive.google.com/open?id=1gDy0HXe-m70OrpgxoOSUDeliucTb8BiI Презентация] Статьи: [https://arxiv.org/pdf/1511.06361.pdf 1] [https://arxiv.org/pdf/1705.08039.pdf 2] [https://arxiv.org/pdf/1804.01882.pdf 3] [https://arxiv.org/pdf/1805.09112.pdf 4]  | ||
| + | 2. Multitask learning.  [https://drive.google.com/open?id=1vfOWC_pYngLnoc-y124vyNmFdCTAPo6e Презентация] Статьи: [https://ronan.collobert.com/pub/matos/2008_nlp_icml.pdf 1] [https://arxiv.org/pdf/1808.07658.pdf 2]  | ||
|- <!-- Конец записи -->  | |- <!-- Конец записи -->  | ||
|- <!-- Новая запись -->  | |- <!-- Новая запись -->  | ||
|-  | |-  | ||
| 26 сентября  | | 26 сентября  | ||
| - | | Доклад по   | + | | Доклад по диссертации "Модели, методы и алгоритмы, устойчивые к шуму, в задачах обработки естественного языка."  | 
| Валентин Малых (МФТИ)  | | Валентин Малых (МФТИ)  | ||
| + | | [https://drive.google.com/open?id=1rZg4B220m2ZnYqw_HOp-GvhTmQGGcxbM Презентация]  | ||
| + | [https://drive.google.com/open?id=1Jt6EvPtDU__7_6uaIWELzaonF0weD9rW Черновик автореферата]  | ||
| + | |- <!-- Конец записи -->  | ||
| + | |- <!-- Новая запись -->  | ||
| + | |-  | ||
| + | | 3 октября  | ||
| + | | Извлечение семантических фреймов и смыслов слов с использованием векторных представлений  | ||
| + | | Александр Панченко (Университет Гамбурга)  | ||
| + | | Публикации в основе доклада:   | ||
| + | 1. [http://aclweb.org/anthology/P17-1145 ACL-2017 paper],   | ||
| + | 2. [http://aclweb.org/anthology/P18-2010 ACL-2018 paper],  | ||
| + | 3. [http://aclanthology.coli.uni-saarland.de/papers/W16-1620/w16-1620 Rep4NLP workshop 2016 (best paper)]  | ||
| + | |- <!-- Конец записи -->  | ||
| + | |- <!-- Новая запись -->  | ||
| + | |-  | ||
| + | | 10 октября  | ||
| + | | Векторные представления предложений. ELMo, Universal Sentence Encoder (DAN or Transformer), Starspace, и т.д.  | ||
| + | | Николай Скачков (ВМК МГУ)  | ||
| + | | [https://drive.google.com/file/d/1XP3GERV03unzE5JWm7pHdEHR3vFbXGjf/view?usp=sharing Презентация]  | ||
| + | |- <!-- Конец записи -->  | ||
| + | |- <!-- Новая запись -->  | ||
| + | |-  | ||
| + | | 17 октября  | ||
| + | | Распознавание речи: история, HMM-GMM, seq2seq with CTC loss, инструменты.   | ||
| + | | Антон Бахтин (Facebook Research)  | ||
| + | | [https://yadi.sk/i/61IONRiwOHeDhw Презентация]  | ||
| + | |- <!-- Конец записи -->  | ||
| + | |- <!-- Новая запись -->  | ||
| + | |-  | ||
| + | | 24 октября  | ||
| + | | Эрмитовы векторные представления слов.   | ||
| + | | Алексей Зобнин (Яндекс)  | ||
| + | |   | ||
| + | |- <!-- Конец записи -->  | ||
| + | |- <!-- Новая запись -->  | ||
| + | |-  | ||
| + | | 31 октября  | ||
| + | | Variational autoencoder.  Гибридные модели VAE+LDA.  | ||
| + | | Коля Шаталов, Настя Фадеева.   | ||
| + | | [https://drive.google.com/open?id=1aeFiEO3yoLjSVlCRgsH4q9Kjrh32Ujcn Слайды VAE],  [https://drive.google.com/open?id=1FELEnkYuXGs8HGuraXoCzyTGxZ478eUD слайды VAE-LDA]  | ||
| + | Статьи: [https://arxiv.org/pdf/1703.01488.pdf 1], [https://arxiv.org/pdf/1809.03664.pdf 2], [https://drive.google.com/open?id=1FELEnkYuXGs8HGuraXoCzyTGxZ478eUDhttps://arxiv.org/pdf/1706.00359.pdf 3]  | ||
| + | |- <!-- Конец записи -->  | ||
| + | |- <!-- Новая запись -->  | ||
| + | |-  | ||
| + | | 7 ноября  | ||
| + | | Goal-oriented dialogue systems.  | ||
| + | | Никита Юдин, Саша Волохова  | ||
| + | | [https://drive.google.com/open?id=1WlLQYuF6Ozv7DYIFIIXoiYXRuaBa3gVQ Презентация]   | ||
| + | Статьи: [http://proceedings.mlr.press/v80/yarats18a/yarats18a.pdf 1], [https://arxiv.org/abs/1802.03881 2].  | ||
| + | |- <!-- Конец записи -->  | ||
| + | |- <!-- Новая запись -->  | ||
| + | |-  | ||
| + | | 14 ноября  | ||
| + | | Модели на основе трансформера: BERT и LISA.  | ||
| + | | Татьяна Савельева, Ксения Вальчук  | ||
| + | | Статьи: [https://arxiv.org/abs/1810.04805 BERT] , [https://arxiv.org/abs/1804.08199 LISA]  | ||
| + | Презентация: [https://drive.google.com/open?id=1gpvHuRO9RrQV1Nv-C392QxmVjpjlu8xM BERT], [https://drive.google.com/open?id=1MnD20aT-gHxPc8YmrBsmWpiW8nScYlpu LISA]  | ||
| + | |- <!-- Конец записи -->  | ||
| + | |- <!-- Новая запись -->  | ||
| + | |-  | ||
| + | | 21 ноября  | ||
| + | | Hyperbolic embeddings - с кодом и примерами.   | ||
| + | | Геннадий Штех  | ||
| + | |   | ||
| + | |- <!-- Конец записи -->  | ||
| + | |- <!-- Новая запись -->  | ||
| + | |-  | ||
| + | | 28 ноября  | ||
| + | | Разборы статей EMNLP-2018  | ||
| + | | Мария Тихонова, Андрей Смирнов, Мария Шеянова, Павел Степачев  | ||
| + | | Статьи: [https://arxiv.org/abs/1804.07755 Unsupervised MT], [http://aclweb.org/anthology/D18-1002 Adversarial learning], [http://aclweb.org/anthology/W18-6017 Кросс-лингвистический парсинг].  | ||
| + | Презентации: [https://drive.google.com/open?id=1euQk0-moNb8oLc1_r-1TDSrimZqN6dSt 1], [https://drive.google.com/open?id=146iLX0f1kJDNvi7XSaZ6xhfsBDD0P3To 2], [https://drive.google.com/open?id=18ALcpsql-iMGQwOR0qs2pPf7dMYxXGYD 3]  | ||
| + | |- <!-- Конец записи -->  | ||
| + | |- <!-- Новая запись -->  | ||
| + | |-  | ||
| + | | 5 декабря  | ||
| + | | Язык и мозг: как все устроено  | ||
| + | | Анастасия Лопухина (Центр языка и мозга, ВШЭ)  | ||
| + | | [https://drive.google.com/open?id=1q3mzutRGAZ8b_4ESCMiP6x8uDhqTawGM Презентация]  | ||
| + | |- <!-- Конец записи -->  | ||
| + | |- <!-- Новая запись -->  | ||
| + | |-  | ||
| + | | 12 декабря  | ||
| + | | Фактовые запросы в поисковиках и выделение взаимосвязей (relations) в тексте.    | ||
| + | | Николай Кругликов, Павел Поляков.  | ||
|   | |   | ||
|- <!-- Конец записи -->  | |- <!-- Конец записи -->  | ||
|}  | |}  | ||
| - | + | == Подстраницы: семинары прошлых лет ==  | |
| - | + | {{Служебная:Prefixindex/Методы анализа текстов (семинар, К.В.Воронцов)/}}  | |
| - | =   | + | |
| - | + | ||
[[Категория:Учебные курсы]]  | [[Категория:Учебные курсы]]  | ||
Текущая версия
Семинары научной группы К.В. Воронцова по анализу текстов (Natural Language Processing, NLP). Разбираем современные статьи из области NLP, работы студентов и приглашенных докладчиков.
Содержание | 
Где и когда
По средам в 19.30 в Школе Анализа Данных Яндекса (ул. Тимура Фрунзе, 11к2) в аудитории Гарвард. Приходить на проходную с обратной стороны Мамонтова (вот сюда) с паспортом.
Проход строго по спискам. Записаться на осенний семестр 2018 года нужно здесь. Внимание: чтобы ваша фамилия оказалась на охране, записаться нужно не позднее вечера вторника.
Контакты и ссылки
Канал в телеграме: NLP_weekly
По всем вопросам: anna.a.potapenko at gmail.com
https://bit.ly/2MXs5t3 — короткая ссылка на эту страницу.
https://goo.gl/rc4grq — короткая ссылка на страницу 2017-2018 учебного года.
Расписание (осень 2018)
| Дата | Тема | Докладчик | Материалы | 
|---|---|---|---|
| 12 сентября |  Обзор статей ACL-2018. Разбор статьи
 Universal Language Model Fine-tuning for Text Classification  | Михаил Архипов (IPavlov) | Презентация | 
| 19 сентября |  1. Order-embeddings and hyperbolic deep learning
 2. Multitask learning in NLP: from 2008 to 2018  |  1. Роман Дербаносов
 2. Татьяна Савельева (Яндекс)  |   1. Hyperbolic embeddings. Презентация Статьи: 1 2 3 4
 2. Multitask learning. Презентация Статьи: 1 2  | 
| 26 сентября | Доклад по диссертации "Модели, методы и алгоритмы, устойчивые к шуму, в задачах обработки естественного языка." | Валентин Малых (МФТИ) | Презентация | 
| 3 октября | Извлечение семантических фреймов и смыслов слов с использованием векторных представлений | Александр Панченко (Университет Гамбурга) |  Публикации в основе доклада:
 1. ACL-2017 paper, 2. ACL-2018 paper, 3. Rep4NLP workshop 2016 (best paper)  | 
| 10 октября | Векторные представления предложений. ELMo, Universal Sentence Encoder (DAN or Transformer), Starspace, и т.д. | Николай Скачков (ВМК МГУ) | Презентация | 
| 17 октября | Распознавание речи: история, HMM-GMM, seq2seq with CTC loss, инструменты. | Антон Бахтин (Facebook Research) | Презентация | 
| 24 октября | Эрмитовы векторные представления слов. | Алексей Зобнин (Яндекс) | |
| 31 октября | Variational autoencoder. Гибридные модели VAE+LDA. | Коля Шаталов, Настя Фадеева. | Слайды VAE, слайды VAE-LDA | 
| 7 ноября | Goal-oriented dialogue systems. | Никита Юдин, Саша Волохова | Презентация | 
| 14 ноября | Модели на основе трансформера: BERT и LISA. | Татьяна Савельева, Ксения Вальчук | Статьи: BERT , LISA | 
| 21 ноября | Hyperbolic embeddings - с кодом и примерами. | Геннадий Штех | |
| 28 ноября | Разборы статей EMNLP-2018 | Мария Тихонова, Андрей Смирнов, Мария Шеянова, Павел Степачев | Статьи: Unsupervised MT, Adversarial learning, Кросс-лингвистический парсинг. | 
| 5 декабря | Язык и мозг: как все устроено | Анастасия Лопухина (Центр языка и мозга, ВШЭ) | Презентация | 
| 12 декабря | Фактовые запросы в поисковиках и выделение взаимосвязей (relations) в тексте. | Николай Кругликов, Павел Поляков. | 
Подстраницы: семинары прошлых лет
| Методы анализа текстов (семинар, К.В.Воронцов)/2017-2018 год | 

