Генеральный директор VisionLabs Александр Ханин рассказал о перспективах технологии распознавания лиц

Генеральный директор VisionLabs Александр Ханин рассказал о перспективах технологии распознавания лиц

vc.ru

VisionLabs — один из мировых лидеров в области создания систем компьютерного зрения и машинного обучения. Флагманским продуктом компании является платформа распознавания лиц LUNA. Основной доход VisionLans приносит финансовый сектор, а именно банки. 27 июля 2017 г. генеральный директор VisionLabs Александр Ханин рассказал vc.ru о перспективах технологии распознавания лиц, MSQRD и специфике работы с западными партнерами.

На каком этапе развития компания находится сейчас?

Мы находимся в активной стадии роста, большая часть нашей деятельности представлена на международном рынке, где-то две трети по сравнению с российским. С декабря 2016 года штат вырос в три раза. Было 18 человек, а теперь — больше 50.

Все сотрудники из России? Или есть иностранные?

Большая часть из России, но мы начинаем привлекать и зарубежных специалистов по региональному принципу.

В каких регионах сконцентрирована основная деятельность компании?

Мы сфокусировались на Китае, Юго-Восточной Азии и США. В некоторых странах мы изучаем партнерства, а дальше по мере запуска проектов будем подключать людей для локализации и технической поддержки.

Европейский рынок вам интересен?

Европейский рынок безусловно интересен. У нас в этом регионе есть партнеры, которые занимаются продвижением наших проектов, но напрямую мы пока не разворачиваем активную деятельность.

А что за партнеры?

Один из них — Deutsche Telekom. А по остальным — в основном взаимодействуем через более крупных вендоров.
Исторически сложилось, что в Европе много компаний по распознаванию лиц, и там уже давно выстроилась инфраструктура для проектов с биометрией и клиентской аналитикой. Так как ряд традиционных вендоров по распознаванию лиц не успевает перестроиться под быстроменяющуюся среду, то в таких случаях нам удается сработать как «горячая замена». Заказчики вынимают немецкий или французский движок и заменяют на наш. Нам даже не нужно фантазировать на европейском рынке, просто находим партнерские каналы, которые раньше продавали традиционных вендоров, а теперь — молодых. Поэтому в Европе каких-то прямых контрактов не предусмотрено.
А в Китае и США могут быть прямые, но по-прежнему развиваем партнерскую сеть, потому что количество наших человеческих ресурсов и ресурсов менеджеров по продажам на все наши планы и амбиции ограничено. Партнерские каналы — это то, на чем мы сфокусировали 90% сил.

Как вы работаете с крупными корпорациями?

С Intel, Qualcomm и Huawei мы работаем напрямую, потому что это или имиджевые, или инфраструктурные проекты. Если мы внедряемся в чип, то есть становимся частью инфраструктуры, то это попадает и к партнерам любого другого уровня. Поэтому мы работаем с крупными партнерами, чтобы в средней и дальней перспективе стать частью инфраструктуры всех уровней, а с системными интеграторами мы ведем деятельность под замену движка на более быстрый, то есть наш.

Какие боевые кейсы у вас уже есть? На какие отрасли вы делаете ставку?

У нас есть несколько новых рабочих кейсов, о которых расскажем в конце осени 2017 года. Сейчас нас ограничивает NDA, поэтому пока рассказать не можем. Это будут проекты в сфере контроля доступа и «умного» дома.

На каком-то конкретном рынке или глобально?

В основном это США и Юго-Восточная Азия. Там представлены первые проекты, которые работают не в тестовом режиме. Мы пока не можем раскрывать имена компаний, это не мегакорпорации, но и в них могут быть масштабные внедрения от сотен до сотен тысяч камер. Большая часть боевых внедрений представлена в России. Более полумиллиона камер, которые обрабатывают фотографии или видеопотоки. В основном в банках.

В России ваше основное направление — финансы?

Да, потому что в этой отрасли на российском рынке легко просчитывается срок возврата инвестиций.
Еще нам интересен ритейл, но там пока уровень проработки кейсов оставляет желать лучшего. В этом сегменте нет масштабных внедрений, когда можно показывать, что это выгодно. Но сейчас у нас в ритейле на российском рынке также идет более десятка пилотных проектов.
В Китае и США делаем ставку на контроль доступа, общественную безопасность и мобильные приложения. Например, аутентификацию с помощью лица.

А что с финансовым сектором на этих рынках?

Я не думаю, что банки или телеком-корпорации будут ключевыми клиентами в США или Китае. Хотя безусловно у них тоже есть кейсы, связанные с мошенничеством. Например, в Китае злоумышленники приходят в салон мобильной связи и по поддельным документам получают дубликат SIM-карты, которая открывает им доступ к банковскому счету. Если добавить обязательное распознавание лица при восстановлении SIM-карты, то у мошенников будет сильно меньше шансов.
Кроме того, в некоторых странах в банковской отрасли серьезное регулирование. Займет несколько лет, чтобы нам со своими решениями попасть в их банки. Мы в России целенаправленно и долго работали, чтобы стать лидерами в этом сегменте.

Как банки воспринимают вас?

В России хоть и проще, по сравнению с Европой и США, но все равно достаточно суровые законы в сфере защиты персональных данных. Но VisionLabs сейчас воспринимают позитивно. Нам неизвестно, что за последние три года кто-то внедрился в банки, кроме нашей системы. Если из этого сделать вывод, то можно сказать, что нас воспринимают уже не как стартап и прототип, а как рабочую систему.
Мы, наверное, и отличаемся тем, что у нас уже есть рабочие внедрения с понятной экономикой — сколько заказчики экономят на нашем решении, какие есть риски при внедрении и какая польза.

С какими банками сотрудничаете в России?

У нас есть контракты с ВТБ, «Сбербанком», «Открытием», «Почта-банком» (у них самое масштабное внедрение биометрии в банке в мире — 50 000 рабочих мест сотрудников), «Тинькофф-банком», «МТС-банком» и еще рядом организаций.
Также есть более 10 пилотных проектов в активной стадии. Многие подключаются через партнеров. Например, VisionLabs сотрудничает с агрегатором данных кредитных историй и фото заемщиков Equifax. Более 60 банков подключено к этой системе, а еще 30 отдают снимки для повышения уровня защиты банков от мошенников с помощью проверки по обширной общей базе заемщиков.
В целом, в России более 30 банков пользуются нашей технологией. Есть еще за рубежом.

Как в Китае обстоят дела с регулированием?

В Китае в области персональных данных не такое жесткое регулирование, как в России, но там приоритет отдается местным производителям. На каждом рынке свои нюансы.
В России VisionLabs недавно получила официальное заключение о том, что наша система полностью соответствует законодательству. Когда мы перешли от стадии пилотных проектов к реальным боевым внедрениям и работали с огромным потоком данных, мы много времени уделили тому, чтобы привести все в соответствие с законом.

Сколько времени на это ушло?

Год на то, чтобы перестроить архитектуру нашего решения, чтобы построить полноценную платформу для распознавания лиц, которая полностью соответствует законодательству. Не только российскому, но и международному.
Но мы не жалеем об этом, такой шаг дал нам конкурентное преимущество.

Конкуренты ломаются в подобной ситуации?

Ряду конкурентов еще только предстоит пройти эти процедуры. Какой бы ты хороший ни был, но если ты не прошел определенных процедур или работаешь в серой или черной зоне, это повлечет проверки деятельности.

У вас есть государственные заказчики?

Напрямую с госзаказчикам мы не работали. Не то, что против этого, просто фокусируемся на коммерческом сегменте, потому что за этим будущее, и там проще просчитать выгоду от внедрения технологий VisionLabs.
Международные отчеты по биометрии свидетельствуют, что доля госзаказов снижается. Она, конечно, все еще львиная, но стремительно растет доля в финансах и контроле доступа.
Если требуется работа с госорганами за рубежом или в России, то есть ряд партнеров, через которых мы взаимодействуем.

Вы сами считаете VisionLabs стартапом?

Это зависит от формулировки, что такое стартап. Кто-то считает, что это до раунда А и B. Кто-то — что это та компания, которая не достигла точки безубыточности или когда она находится на стадии проверки гипотез. Но когда это уже работающий бизнес, то его сложно назвать стартапом. Мы себя уже не воспринимаем таковыми, потому что прошли раунд А и точку безубыточности.
Мы прибыльная компания, у которой есть ряд рабочих решений. Как минимум, у нас есть финансовый сегмент, где все проработано до малейшей детали. Здесь нас точно нельзя назвать стартапом.
Может, мы такие в отношении новых направлений, но в этом случае из-за того, что ИТ-отрасль так динамично меняется и революции происходят каждые полгода, мы постоянно будем в хорошем смысле стартапом. То есть всё время будем адаптироваться под меняющийся рынок, создавая новые продукты и направления, и задавать тренды.

Вы сейчас работаете на полной самоокупаемости. А что с инвестициями?

Мы проходили несколько акселераторов — в университете в Беркли (Калифорния), Intel T2MA, ФРИИ и еще Generation S от фонда «Сколково».
Наибольший эффект нам дал университет в Беркли, потому что мы были тогда совсем «зеленые» и это был наш первый акселератор, который помог сфокусироваться на конкретных проблемах.
Первые инвестиции были от ФРИИ — около миллиона рублей, затем летом 2016 года в нас инвестировал венчурный фонд Sistema VC — 350 млн рублей при оценке компании в 1,4 млрд рублей.

Есть мнение, что русским стартапам тяжело на Западе.

Наверное, если смотреть общую статистику, можно сделать такие выводы, но мы не сталкивались с такой проблемой. Мне кажется, если компания четко и внятно излагает суть своего бизнеса, то нет барьеров, чтобы не брать ее в акселератор или заключать с ней соглашения о сотрудничестве.

А с зарубежными партнерами нет проблем?

Работая с ними, мы сталкивались с долгим циклом согласования проектов, нужно было подписывать NDA и соглашение о намерениях. Но в целом мы не ощущаем давления или каких-то больших сложностей. Иногда про нас шутят: «А, русские хакеры. Значит, умные ребята».
Мы много и целенаправленно работали, чтобы получить какое-то международное признание. Например, если прийти в какую-нибудь американскую компанию и сказать, что подписали контракт с банком из списка топ-10 в России, то это не имеет значения. Но если сказать, что развернули свое решение, например, в Deutsche Telekom, у нас есть официальный статус Facebook Supplier и мы можем дать контакты людей не из России, которые подтвердят нашу состоятельность и адекватность, то это воспринимается позитивно.

На ваш взгляд, конкуренция в сфере распознавания лиц высокая?

Последнее время она очень активно растет по всему миру. Если раньше компаний, которые занимаются распознаванием лиц, было несколько десятков, то сейчас их больше тысячи. Основное количество сконцентрировано в Китае, где каждый университет делает свою технологию. При этом лишь пара десятков компаний обладают рабочими проектами и готовым продуктом.
Достаточно легко можно создать хорошую технологию, понадобится еще какое-то время, чтобы она вошла в топ-10, но последняя миля — доведение до клиента — самая сложная. Хайп пройдет и встанет вопрос, где здесь деньги, как зарабатывать и как сэкономить при помощи распознавания лиц.

В каком состоянии сейчас находятся решения в этой области?

Уже все более или менее работают на одном уровне, нет аутсайдеров и явных лидеров.
Я не думаю, что вливание огромных инвестиций даст технологический прорыв именно в разработке технологий по распознаванию лиц.
Фокус смещается от самой технологии к ее применению.

В каких направлениях будущее технологии распознавания лиц?

Сейчас компании, в том числе VisionLabs, тестируют гипотезы. Мы для себя нашли дополненную реальность и анализ динамики лиц — это оказалось намного сложнее, чем распознавание.
Мы слышали от коллег по цеху, что такую технологию, как у MSQRD, можно было сделать за выходные. Но что-то никто из конкурентов этого даже за год не сделал. Однако мы создали виртуальные маски и технологию, которая устойчива к нестабильному освещению, повороту головы и мимике.
Эта сфера действительно сложная и перспективная. Думаю, если кто-то сделает прорыв в повышении качества трекинга точек на лице и поверхности лица — это откроет новые возможности всем игрокам. Речь идет о замене лиц, и модификации лиц на ходу, полувиртуальных видеоконференциях и других проектах.
Мне кажется, что надо в эту сторону развиваться. VisionLabs уже выпустила технологию Face.DJ, которая строит 3D-аватар по селфи с обычной камеры мобильного устройства. Демо-версия приложения доступна для владельцев iOS-устройств.
Face.DJ сделан, в первую очередь, для внедрения в компьютерные и мобильные игры — для персонализации героев. По нему пока еще нет крупных контрактов и внедрений, так как он был только анонсирован в мае 2017 года, но есть по виртуальным маскам. Среди наших клиентов в этом направлении — Mail.Ru Group, которая использует решение во всех своих мессенджерах.

Разве эта технология предназначена не для развлечения?

Она только кажется развлекательной. Но мы правильно поступили, что пошли в эту «фановую» часть, так как она автоматически затрагивает миллионы пользователей. А отладиться на таких больших объемах — дорогого стоит.

Как можно зарабатывать на этом решении?

Один из примеров — видеозвонки. Вы можете выбрать себе виртуальный аватар, который будет повторять ваши движения и эмоции. Он позволит общаться с собеседником, не транслируя видео на его сторону, а управляя лишь этим образом через отправку сигналов.
Такое решение сэкономит трафик и добавит новый пользовательский опыт.

Какие еще новые направления вы рассматриваете?

Мы научились хорошо оценивать точки и форму лица. Можно сказать, что мы шагнули от таких вещей, как базовое распознавание эмоций — оно было когда-то очень модным, но не нашло реального применения в бизнесе — к распознаванию микродвижений лица. Мимика у каждого человека разная, а значит, под каждого нужно делать если не калибровку, то какую-то адаптацию.
VisionLabs сделала технологию, которая позволяет отслеживать форму лица и точки, чтобы помогать HR-отделам принимать решение о найме сотрудников на основе анализа поведения, динамики и реакции на вопросы.

«Lie to me» в технологическом смысле?

Да, верно, мы видели массу подходов, когда пытались оценивать эмоции человека, когда он смеялся или хмурился. Но практика показывает, что надо анализировать некую интегральную оценку, паттерн за определенный промежуток времени. Примерно в октябре 2017 года мы сможем рассказать подробнее об этих проектах.

Вы привлекаете психологов и физиогномистов?

Нет, мы работаем в парадигме машинного обучения. Никто точки из современных вендров для самого распознавания лица не использует. Мы используем только «сырую» картинку, значение пикселей и ряд классификаторов. Также задействуем нейронные сети, которые позволяют принять решение — один и тот же человек изображен на фото или разные люди.
Сейчас, ввиду того, что у нас есть доступ к большому объему статистических данных, мы знаем, например, что на десяти фотографиях один и тот же человек в разных условиях — молодой, старый, улыбается, плачет. Таких файлов у нас сотни тысяч.
Мы отвергаем человеческий опыт и полагаемся на машину, которая сама найдет параметры, по которым принимать решение.
То же самое мы используем при принятии решений — подходит кандидат или не подходит, позитивная у него реакция или отрицательная. У нас с технологическими партнерами уже есть такие продукты в разработке.
Если взять одно и то же собеседование, точнее один и тот же видеофрагмент из него, и показать 10 разным психологам, то скорее всего, уже нам придется вызывать психолога себе, потому что все дадут разные ответы.

Откуда вы берете данные?

Мы работаем с партнерами, но сами не храним сведения.

Как вы относитесь к мнению пользователей о том, что технологии распознавания лиц напоминают Большого брата из романа «1984»?

Технология позволяет сделать очень много и в рамках, и за рамками закона. Тут уже речь о том, как клиент будет ее применять.
Действительно ведется много разговоров об использовании изображения лица, идентификации личности по изображению. Но если положить на чашу весов плюсы и минусы, то положительных моментов оказывается сильно больше.
Я не видел ни одного пользователя, выступающего против биометрической идентификации, у которого мошенники в банке украли деньги.
К тому же, все устали от человеческого фактора. Когда появляется система, которая позволяет качественно автоматически обслуживать клиента, это облегчает жизнь всем.
Есть операции, которые сейчас требуют длительной процедуры идентификации по лицу. Да, это может сейчас казаться неудобным, но это для безопасности. Мы не сталкиваемся с негативом, хотя у нас статическая база немалая. Мы сотрудничаем с рядом крупнейших банков в России и за рубежом, с самыми разными сегментами — как с молодежью, так и людьми зрелого и пенсионного возраста. Каких-то жалоб не получаем, все воспринимают позитивно.
Проводился ряд соцопросов нашими клиентами, которые сравнивали разные биометрические технологии. Большинство выбирает лицо, так как сейчас век селфи, все привыкли фотографироваться, это просто и быстро. Люди к этому относятся как к комфортной процедуре. Негативно скорее воспринимают, например, отпечатки пальцев, если это не сканер телефона, а внешний сенсор, потому что есть ассоциации с криминальным миром, да и негигиенично.

Оригинал: vc.ru 27 июля 2017 «Ажиотаж пройдет и встанет вопрос о том, где в сфере распознавания лиц деньги»