Россия с точки зрения машинного обучения никогда не отставала

Россия с точки зрения машинного обучения никогда не отставала

Михаил Парахин рассказал журналисту «Медузы» об отношении к русским разработчикам в США, о конкуренции с Google и о состоянии «Яндекс.Новостей». Михаил родом из ближнего Подмосковья, прожил в Штатах 13 лет, половину из которых проработал в компании Parascript, где занимался машинным обучением, в основном связанным с распознаванием текста — рукописного и печатного. Еще семь лет проработал в Microsoft, поднявшись до должности руководителя поиска по картинкам и видео Bing. В 2015 году Михаил Парахин занял пост директора по технологиям «Яндекса».  

О российской школе машинного обучения

«Россия с точки зрения машинного обучения точно никогда не отставала. И с точки зрения индустриального применения… мне трудно говорить про всю Америку, но в тех кругах, в которых я общаюсь, сильное мнение, что в России, возможно, масштабное индустриальное применение началось раньше. У меня есть конкретные примеры.

Первыми действительно успешными, измеряемыми, условно, сотнями миллионов долларов, применениями машинного обучения, которые я знаю, было распознавание рукописного и сложного печатного текста. Вот был у Apple компьютер Newton. Кто в нем делал распознавание рукописного текста? Русские делали.

Была тогда компания Paragraph. Приехали в начале 1990-х тогда еще в Советский Союз представители Apple. Параграфцы пришли и говорят: мы можем делать что угодно. Все это сложилось случайно, потому что в Союзе тогда были Шеля Губерман и другие энтузиасты распознавания рукописного текста, которые занимались этим с 70–80-х годов, а на Западе этим почему-то не занимались. И в Paragraph сделали отличный распознаватель для Newton, который сейчас, после многих инкарнаций и покупок-продаж авторских прав, встроен в Windows.

… А когда USPS решила автоматизировать распознавание текста на конвертах — они проводили тендер между Lockheed Martin и Siemens. И та и другая в итоге стали покупать технологии распознавания у кого? У русской компании Parascript, которая потом открыла представительство в США, в Колорадо. «Яндекс», кстати, купил русскую часть Parascript пару лет назад.

А когда я еще работал в России, было такое ЗАО НТЦ «Модуль», которое занималось многими ныне популярными вещами. Впервые, наверное, в России там начали применять то, что сейчас называется сверточными нейронными сетями, — для обработки изображений, работы с картами, выделения на них дорог. То, что сейчас работает в наших картах, — это все делалось в 90-х годах и делалось вполне в России. Я не хочу сказать, что в Штатах было хуже, — наверное, там были такого же масштаба компании, может больше, но они точно не были сильно больше. И точно в США такая разработка не была более централизованной.

Машинное обучение — это в каком-то смысле новое развитие статистики, а в статистику и функциональный анализ и в Советском Союзе, и в России много вкладывались. Здесь у нас точно нет никакого отставания. Я бы даже сказал, что с точки зрения применения машинного обучения в индустрии Россия всегда сохраняла паритет.»

Об успехах «Яндекса» в машинном обучении

«Из достижений последних 12 месяцев я бы выделил три. Во-первых, «Палех», это наша технология глубоких нейронных сетей, которая создана для понимания сути и смысла текста. Ты берешь текстовый запрос и переводишь его в некое векторное пространство, как бы оцифровываешь. То же самое делаешь со всеми известными тебе страницами в интернете. И вот чем ближе вектор запроса к вектору страницы в этом пространстве — тем лучше страница отвечает на запрос. То есть можем найти релевантную статью, даже если в ней и в поисковом запросе ни одного слова не совпадает, но по смыслу они друг с другом отлично соотносятся. Мы «Палехом» очень гордимся, считаем, что эта технология с определенным запасом лучшая в своем роде.

Вторая вещь — это радикальный скачок в качестве распознавания голоса. Раньше мы были примерно в паритете с Google, сейчас мы по всем нашим измерениям на голову стали выше. И сильно уменьшились задержки в распознавании — это тоже большая технологическая составляющая, которая связана с машинным обучением, потому что в распознавании голоса очень важно как можно быстрее дать пользователю ответ. То есть ты не можешь запускать на телефоне очень большие, тяжелые алгоритмы, а для того чтобы быстро отвечать с сервера, нужно оптимизировать данные так, чтобы все работало даже на слабых каналах связи. Мы считаем очень большим успехом сильное улучшение распознавания голоса.

И в рекламе я бы выделил так называемую технологию Broadmatch… Раньше тебе надо было всегда, когда ты размещаешь в поиске контекстную рекламу своего бизнеса, например продаешь пластиковые окна, указать: если идет запрос «пластиковые окна», то показать мою рекламу. При этом я как человек не знаю, какие еще запросы задают пользователи, ищущие в «Яндексе» пластиковые окна, и какая частота у этих запросов. …Broadmatch — это технология, которая говорит рекламодателю: «Не надо забивать все слова, по которым, как тебе кажется, нужно показывать твою рекламу. Я все это сделаю за тебя». Она сама оценит вероятность того, насколько хорошо подходит объявление под разные неочевидные запросы, и сама понизит ставку так, чтобы тебе суммарно было экономически выгоднее рекламироваться.»

Оригинал: Meduza, Большое интервью директора по технологиям «Яндекса» Михаила Парахина

На фото: директор по технологиям «Яндекса» Михаил Парахин