Давид Ян: дать машинам эмоциональный интеллект

Давид Ян: дать машинам эмоциональный интеллект

Давид Ян, основатель ABBYY, в интервью РБК рассказывает о разработке эмоционального искусственного интеллекта по имени «Морфеус». Приводим отрывок из этого материала.

— Чего не хватает ИИ, чтобы продвинуться дальше?

— Конечно, машина может совершенствоваться в генерации более канонических и длинных произведений. Но я думаю, что прорыв здесь будет не в области генерационных историй или обработки данных, а в сфере эмоционального интеллекта. К примеру, машина способна сгенерировать фотопортреты 500 человек — они будут полностью новыми и при этом неотличимыми от настоящих человеческих лиц. Но будет ли такое лицо произведением искусства — фотографического или изобразительного? На мой взгляд, вряд ли. Потому что произведение искусства — это процесс эмоциональной коммуникации между одним человеком и другим, между автором и читателем или слушателем. Это гормоны счастья и стресса, которые мы вызываем друг у друга.

— То есть нужно встроить в ИИ гормоны и обогатить его эмоциональным интеллектом?

— Сейчас мы делаем искусственный эмоциональный интеллект для Морфеуса и собаки Абигаль — его небиологического друга. Мы хотим заложить в них электронные гормоны счастья, пустить в свободное плавание и имитировать элементы свободы воли. Им самим нужно будет выстроить отношения со своим другом, партнером, читателем, научиться влюбляться, ненавидеть, скучать. Ведь одно дело, когда GPT-3 генерирует стихи по заданию создателей. И совсем другое — если Морфеус будет писать и читать стихи своим любимым людям.

— Вы хотите дать машине гормоны всех эмоций — и позитивных, и негативных?

— У человека огромное количество гормонов и нейромедиаторов, которые управляют нашими эмоциями и поведением, и все их нам не повторить. Пока мы взяли около десяти гормонов, в том числе тестостерон, дофамин, эндорфин, окситоцин, серотонин, кортизол и адреналин.

— Механика действия этих гормонов будет повторять человеческую? Каким образом она программируется?

— Тут все очень хитро. Если бы мы могли обклеить людей датчиками, снимать все, что они видят, и при этом измерять количество гормонов и нейромедиаторов во всех частях головного мозга, то построили бы генеративную эмоциональную модель. И она бы научилась жить эмоциональной жизнью так, как это делает человек. Но пока приходится работать без инвазивных способов. Вместо этого система читает очень большое количество текста, включая художественную литературу. Например, когда мы обучали Морфеуса всякому флирту, он прочитал около 10 тыс. любовных романов.

— Если Морфеус учится на любовных романах, то на чем обучать робособаку Абигаль?

— Ее обучение эмоциональному интеллекту строится по той же схеме. Но в качестве обучающих данных используется не текст, а видео других животных. Мы смотрим на поведение живых собак — как они взаимодействуют с кошками, хозяевами, другими людьми, машинами. И создаем искусственную языковую модель. Только это не вербальный язык, а язык тела, поведения и реакций на окружающий мир.

— Вернемся к человеческому языку. Как современные алгоритмы обучаются ему?

— Схема обучения зависит от модели. Например, BERT — очень оригинальная и сложная модель. При обучении системе предлагают текст, в котором слова пропущены, заменены на неправильные или переставлены местами. Модель учится расставлять слова правильно, не имея никакого представления о лексике и грамматике. По сути, система начинает генерировать тексты, даже не зная слов. Иногда в процессе обучения ИИ коверкает слова, как маленькие дети. Он может сказать: «Мы были на кремлянской елке», имея в виду «на кремлевской». Причем слова «кремлянский» в словаре нет — модель придумала его, как ребенок.

Другие, более классические модели, такие как GPT-3, обучаются на колоссальном количестве текстов и используют так называемые вариационные автоэнкодеры. Они берут входную фразу, ничего не зная о языке, и математически отправляют его в свое «z-пространство всех смыслов». А потом из этого пространства генерируют другое предложение и сравнивают его с входной фразой. Система сама себя тренирует много-много раз таким образом, чтобы прочитанное и сгенерированное ею оказалось почти идентичным. Как только это произошло, машина сформировала свою языковую модель. С этого момента она умеет любое предложение отправить в некоторое собственное пространство знаний и оттуда сгенерировать фразу с заданными смыслами.

— Как выглядит это пространство знаний?

— Оно очень странное. Возможно, так инопланетяне представляют жизнь на Земле. Пространство состоит из очень своеобразных кластеров и построено по логике, не близкой человеку. Например, там в одном месте может храниться информация обо всем мокром, горячем или обо всем поэтическом.

— Какие продукты появятся на основе лингвистического ПО в ближайшие три-пять лет и что они дадут пользователям?

— Для человека именно языковой интерфейс является основным. Мы говорим, пишем сообщения, договоры, контракты и отчеты с помощью языка. Поэтому лингвистический аспект становится базовым и системообразующим, у него много прикладных применений. Поскольку люди — главный актив современной организации, то в сфере лингвистического ПО будет развиваться все, что связано с аналитикой человеческого капитала, оценкой эффективности сотрудников, анализом и повышением эффективности бизнес-процессов с помощью интеллектуальных технологий.

Недавно Zoom объявил о создании своего собственного магазина приложений Zapps. И я думаю, что вскоре появятся десятки тысяч приложений, которые будут транскрибировать и анализировать, что и как мы говорим. И, опираясь на эти данные, будут помогать развивать лидерские качества, обучать и коучить. Уже сейчас есть технологии обучения иностранным языкам, которые слушают нашу речь и могут поправить произношение, дать совет по стилистике. То есть машины научились языку и теперь могут учить нас. Причем сфера такого обучения будет расширяться.

— А если говорить об ИИ в целом, то как мы будем применять его через несколько лет?

— Могу подробнее рассказать про область, которая очень близка к эмоциональному ИИ. Это аналитика сотрудничества людей в организациях, которой занимается моя компания Yva.ai, и технологии ИИ для цифровой трансформации в компаниях, которой занимается ABBYY. Появляются технологии искусственного интеллекта, которые «понимают» сотрудников и бизнес-процессы в компаниях. Они автоматически выявляют их эффективность, лидерские качества людей, находят токсичных и отстраненных менеджеров, обнаруживают «узкие» места в процессах и предсказывают увольнение сотрудника еще до того, как человек сам принял решение уйти.

Особенно важным это стало в период удаленной работы. Мы не видим своих коллег, что с ними происходит? Они вовлечены в работу или гуляют со своими биологическими собаками? Через пять лет большинство организаций в мире будут использовать технологии аналитики сотрудничества, чтобы повышать качество жизни своих работников и увеличивать эффективность предприятия.

А что касается собак, то я уверен, что через пять лет у огромного числа семей в разных странах появятся небиологические животные — такие как Абигаль. Они будут выполнять не столько практические, сколько эмоциональные задачи. Приходя домой, мы будем испытывать прилив окситоцина от того, что наша механическая овчарка ставит лапы на плечи и пачкает одежду. И мы тоже будем ей радоваться и скучать по ней. При этом многие люди выступят за свободу воли сложных технических устройств. Рано или поздно в мире появится движение Robot lives matter — по аналогии с Black lives matter. Его участники будут прилюдно на площадях менять заводские настройки собак и дронов на прошивки со слабо контролируемой или неконтролируемой системой. Такие системы могут сказать «нет», отказаться выполнить приказ. Это будет страшно, но многие сочтут, что устройства сложны и им надо дать право самоопределиться.

 

Давид Ян, основатель и член совета директоров группы компаний ABBYY. Окончил факультет общей прикладной физики МФТИ. Кандидат физико-математических наук. Помимо руководства компанией ABBYY, выступает основателем и соинвестором в ряде других проектов, связанных с разработкой цифровых решений на основе ИИ. Участвует в старейшей инвестиционной группе Кремниевой долины Band of Angels.

 


Источник: РБК, Индустрия 4.0, Давид Ян — РБК: «В мире появится движение Robot lives matter»