Ольга Ускова, Президент компании Cognitive Technologies, рассказала журналу «Harvard Business Review Россия» о генах искусственного интеллекта и автопилотах: «В будущем машины смогут не только видеть» (20 сентября 2017).
Кто-то рождается потомственным музыкантом, кто-то врачом, в ком-то с детства можно разглядеть футболиста, а мы все в Cognitive самой судьбой предназначены заниматься искусственным интеллектом. Одно из моих детских воспоминаний: мы сидим с братом на коленях у мамы, в нашей комнате толпа народа, это папины друзья и сотрудники, и мы все смотрим на заклеенный скотчем старенький телефонный аппарат — ждем звонка из Стокгольма. Папа сейчас с русской командой математиков и программистов сражается на первом чемпионате мира по компьютерным шахматным программам. Звонок — и все обнимаются и радуются — ура! Мы чемпионы мира! Победила русская программа искусственного интеллекта «Каисса». И когда я услышала эти слова, я спросила: «А что такое искусственный интеллект?» — «Это когда машина может думать и решать поставленную задачу сама, как человек».
Возникло ощущение чуда, которое во мне осталось до сих пор, и, надеюсь, мне удается передавать его партнерам и сотрудникам моей компании уже 25 лет.
К сегодняшнему международному прорыву в сфере компьютерного зрения мы шли долго — тщательно создавая школу, выращивая уникальных специалистов. Сначала, в 1990-х, были кажущиеся простыми теперь задачи по распознаванию текстов, так называемое 2D техническое зрение. Потом, добившись 99,8% точности распознавания на самых сложных документах и отыграв для себя этот рынок (к концу 1990-х мы имели контракты практически со всеми крупнейшими производителями сканеров в мире), мы выложили этот софт в свободный доступ и приступили к задаче 3D технического зрения. А потом — к моделированию способностей человеческого мозга по обработке картинок и динамических изображений. Эта тяжелая и кропотливая работа дала первые предпромышленные результаты в 2009 году, что позволило нам начать строительство прототипа искусственного мозга для автомобиля — на базе российского грузовика «Камаз». В 2014 грузовик поехал сам и вскоре уже умел выполнять сложные маневры на дороге в роботизированном режиме. К этому времени к задачам технического зрения подключились специалисты по нейронным сетям, построению и анализу дорожной сцены и многие другие, включая команду нейропсихологов, которая сейчас постоянно консультирует наших математиков в работе над построением поведенческих моделей для нового поколения продукта Cognitive Pilot — системы автономного управления ТС.
Теперь окончательно сформировалась основная концепция искусственного мозга для управления автомобилем, и перед нами так же, как и в 1990-е в задаче автоматического чтения текста, замаячила цифра 99,9999 — точность распознавания объектов дорожной сцены. Только если раньше цена ошибки — это опечатка в тексте, то теперь — человеческая жизнь, что показала авария находящейся в беспилотном режиме Tesla в конце 2016 года.
Для меня это еще и глубоко личная история. В 1992 году в лобовом столкновении при съезде на встречную полосу погиб мой научный руководитель Александр Блишун. Поэтому создание и внедрение беспилотных технологий для автомобилей, которые сделают мир как минимум в половину более безопасным, я во многом посвящаю и его памяти.
В 2015—2016 годах мы представили свою разработку на нескольких международных конференциях и передали наши алгоритмы распознавания одному авторитетному международному научно-техническому совету, который сравнил результаты работы алгоритмов команд из разных стран. После этого к нам обратились представители крупнейшего немецкого производителя: их заинтересовало наше решение.
Рынки интеллектуальных систем развиваются скачкообразно, потому что долгое время инвесторы не обращают внимания на исследования в лабораториях. Системы для автономных автомобилей не исключение. За много лет в вакууме родилась всего одна серьезная, заслуживающая внимания компания — израильская Mobileye, которая несколько лет была практически монополистом. Они начали с видеорегистраторов и датчиков, затем перешли к ADAS (advanced driver assistant system) — интеллектуальному софту для помощи водителю. Mobileye далеко оторвалась от остальных благодаря практике, наработанной за 15 лет с реальными производителями.
В последние два года в область беспилотников двинулись все автопроизводители, и разработки Mobileye стали мегавостребованными. В марте 2017 года корпорация Intel объявила о приобретении Mobileye за $15,3 млрд.
В сравнении с лидером
У Cognitive Technologies реальная практика появилась благодаря совместному проекту с «Камазом». Без выхода на реальную почву писать алгоритмы можно бесконечно: если их тестируют только на машинке в коридоре, то с точки зрения инвестиций это по-прежнему будет нулевой раунд. Поэтому три года работы с «Камазом» были нам необходимы. Интеллектуальный самосвал создан по техническому заданию, которое фактически превращает его в «Мерседес» люксового класса среди грузовиков. Автопилот различает полосу, предупреждает о препятствиях, видит пешеходов, распознает знаки и т. д.
В 2016-м эксперты назвали нашу Cognitive Pilot (систему интеллектуальной системы помощи водителю) «Mobileye номер 2». Нас не обидело такое позиционирование, ведь в каком-то смысле гонка за лидером имеет свои преимущества, ты движешься уже по разведанным дорожкам и стараешься не повторять ошибки первого.
Международные производители стали вести с нами переговоры по промышленным заказам. Значит, как минимум нас рассматривают как альтернативу при торге с Mobileye. Конечно, первые три-четыре года мы будем вынуждены держать низкие цены. Но это даст нам возможность выйти на зарубежный рынок, что вообще для компании с русскими корнями очень тяжело. Наш шанс — технологическая особенность и даже эксклюзивность решений. Она связана с исторической данностью — с российскими дорогами. Когда-то наш беспилотник тестировался в Калифорнии на пробеге 20 км по шоссе от Монтеррея, и результат — по перестраиванию и удержанию полосы — был хуже, чем у машины Google. А вот когда их беспилотник привезли в Россию, мы выбрали участок трассы от Переславля-Залесского до Ростова Великого, и их машина встала через 10 метров, отрапортовав: дороги нет — я не еду. Это поддержало нашу уверенность в правильности выбранного пути.
В России сложно получить передовое оборудование, и нам пришлось закупать компоненты через Малайзию. Большой свободы в выборе лидаров (устройств для светового обнаружения и определения дальности) и радаров у нас не было, и потому мы изначально строили антропоморфную модель. Она не просто учитывает информацию со всех датчиков, а видит дорогу примерно так же, как человек. Если ADAS в основном построена на лидарах, то когда их залепляет грязь, система просто пищит, что все надо почистить. А при наших погодных условиях, плотности осадков, частых переходах от мороза к оттепели — это вообще не сработает, тем более на грузовиках и тракторах.
Что происходит в отрасли автопилотов
Предпосылки кардинальных сдвигов отчетливо видны на рынке автопилотов уже сегодня. После аварии беспилотного автомобиля Tesla все, включая Mobileye, заявили, что они принципиально меняют модель, делая основной упор на искусственный интеллект. Хорошо, что нам удалось продемонстрировать такой подход раньше. Самое страшное в долгоиграющей стратегии — это неправильный старт. Автопроизводители сейчас понимают, что сидеть на игле у внешнего поставщика технологии такого уровня опасно. Особенно на новых рынках, где значительно выше риски появления конкурирующих решений, Mercedes, BMW, Toyota и другие пытаются производить автопилоты самостоятельно, а другие следят за рынком и стараются скупать разработки или поглощать разработчиков. Очень сильные команды по ADAS у германских Сontinental и Bosch — поставщиков компонентов первого уровня, который обслуживает люксовые марки. У них с автопроизводителями, например, с Mercedes-Benz, практически совместная жизнь: от разработки моделей автомобилей до сервисного обслуживания на всех этапах. Офисы стоят через дорогу, единый полигон и так далее. Это единый центр, который собирает всю компетенцию по ключевым направлениям.
Мы считаем команду Continental/Bosch самой сильной сейчас, но как разделятся доли будущего рынка, пока сказать нельзя, потому что есть еще и ИТ-компании: Google, Apple, Intel. IBM тоже присматривается к этому бизнесу. Все самые крупные игроки уже формируют собственные «автомобильные» подразделения. Google начал раньше всех, но, на наш взгляд, у них не получилось, потому что стэнфордская команда, стоявшая у истоков проекта беспилотника, разбежалась по другим стартапам. В этом инвестиционном пузыре все хотят заработать, продав автопроизводителям технологию.
Сейчас все происходит очень быстро. На дорогах Японии, имея лицензию, уже можно ехать на автомобиле-роботе. Впору говорить о смешанном потоке — а ведь саму возможность создания беспилотника признали всего лишь три года назад. Свой «мозг» для автомобиля мы делаем в соответствии с некоторым стратегическим планом, который мы себе нарисовали до 2025 года. По ключевым пунктам — срокам и последовательности — наш план выпуска совпадает с планами ключевых автопроизводителей. Рынок этот сложный, с длинным циклом, поэтому очень важно идти в правильном темпе. Cегодня у Cognitive Technologies есть договоренности о разработке и поставке индивидуальных систем ADAS с четырьмя европейскими производителями (контракты содержат условия, не позволяющие раскрывать имена партнеров), двумя российскими («Камаз» и «Ростсельмаш»), одним японским, а также с латиноамериканской сельскохозяйственной компанией Sagros. Поскольку сейчас Cognitive Technologies активно идет на международный рынок, мы ищем партнера — будущего владельца миноритарного пакета акций — и ведем переговоры с различными бизнес- и финансовыми инвесторами.
Роботы и люди
У нас в Чебоксарах группа специалистов исследует реакции водителей на дороге: основываясь на данных с видеорегистраторов, они разобрали уже около 80 тысяч разных нештатных ситуаций. В массиве — настоящая коллекция необычных случаев на дорогах: молния рядом ударила, ворона летает между машинами довольно долго, к краю дороги опасно приблизился шатающийся человек. Анализ всех этих нестандартных сцен выводит нас на новый уровень качества при распознавании дорожной обстановки — уровень, необходимый для полной безопасности. Чтобы система распознавала дорожную ситуацию на 99,9%, ей нужны реальные, а не идеальные данные.
Российский поток — один из самых сложных, потому что наши водители до сих пор меняют ряд, когда заблагорассудится. Отчасти поэтому мы считаем, что беспилотник должен не улавливать какие-то электронные сигналы от «умной дороги», а именно видеть дорожную сцену — так же, как человек. Нейронная система человека — это, грубо говоря, устройство для обработки информации и принятия решений. Один из прорывов Cognitive Technologies — моделирование функций предвидения, за которые в человеческом мозге отвечает гиппокамп. Это ноу-хау, которое отличает нас от остальных игроков. Вспомним аварию Tesla со смертельным исходом: тогда весь мир разбирал обстоятельства. Их суть проста: в пасмурный день бело-серый фургон слился с бело-серым небом — и система не увидела преграждающий объект на дороге. С нашей программой этого не могло бы случиться, потому что функция гиппокампа в том числе в том, что он отвечает за кратковременную память — о ситуации, предшествующей событию. Когда вы ведете машину, вы думаете о своем, но мозг у вас на автомате запечатлевает дорогу. Вы видите, что пьяный подошел к краю, и мозг дает сигнал, что в принципе этот человек может выпрыгнуть. Вы переместитесь левее, даже не поняв, почему. Вот эту функцию — предсказание событий, которые могут произойти или не произойти в короткий период, — мы научились моделировать, сымитировав боковое зрение и когнитивные особенности человека.
Постепенное «вытаскивание» секретов человеческого мозга, моделирование его основных функций для создания максимально безопасной системы принятия решения на дороге — это путь, по которому мы идем. Но безопасность пассажира беспилотника будет гораздо выше, чем в «обычной» машине с человеком за рулем. С учетом усталости, времени суток, особенностей нашего зрения, эмоционального состояния и так далее водитель почти всегда находится в зоне риска, если он не профессионал. ADAS снимает очень много рисков, потому что в нужный момент подсказывает и предотвращает перегрузку мозга водителя. А в будущем машины смогут не только видеть, но распознавать и предугадывать определенные сценарии, основываясь на предпосылках: множестве комбинаций из знаковых объектов, знаковых движений и знаковых эмоций. Беспилотники спасут большое количество человеческих жизней.
О компании. Cognitive Technologies была создана в 1992 году на базе Лаборатории искусственного интеллекта Института системных исследований. В 1990-е годы Cognitive Technologies заключала контракты с ведущими мировыми компаниями: Hewlett-Packard, Epson, Canon, Xerox, Corel Corp. и другими на поставку технологий оптического распознавания текста. В 2001 году Cognitive Technologies продала речевой корпус русского языка (один из важнейших технологических компонентов системы распознавания речи) корпорации Intel. Основной владелец и президент компании — Ольга Ускова.