Глубокое обучение с подкреплением в приложении к задаче передвижения роботов. Сергей Панков

Семинар 26 ноября 2018 г. из курса открытых семинаров МФТИ по искусственному интеллекту AI@MIPT. На семинаре рассмотрены современные методы обучения с подкреплением, актуальные для задач с непрерывными моделями, применительно к задаче локомоции. Выступает Сергей Панков, выпускник МФТИ, сотрудник лаборатории машинного обучения HSLabs.

Из текста анонса семинара:

Последние несколько лет методы глубокого обучения с подкреплением показывают впечатляющие результаты в различных задачах локомоции (т.е. движения, перемещения) роботов в рамках компьютерных симуляций (моделирования).

Несмотря на это, применение этих методов к локомоции реальных роботов пока не получило широкого распространения. В реальных системах предпочтение отдаётся более традиционным методам управления и оптимизации, основанных на знании моделей и уравнений движения, (см., например, роботы Boston Dynamics).

В чём причина? На семинаре будут рассмотрены некоторые современные методы обучения с подкреплением, актуальные для задач с непрерывными моделями, будут обсуждены их достоинства и недостатки применительно к задаче локомоции. Также будут указаны некоторые аспекты задач, которым, по нашему мнению, уделяется недостаточно внимания, но которые важны для успешного перехода от мира симуляций к реальным роботам.

Источник: Math-Net.Ru Семинары: С.Панков, Глубокое обучение с подкреплением в приложении к задаче локомоции роботов