Нетология: Кто такой Data Scientist — глазами работодателя

Нетология: Кто такой Data Scientist — глазами работодателя

netology.ruВ блоге компании «Нетология» на Хабре опубликовано интервью с представителями компании Авито и HR-агентства Spice IT о том, чего ждет рынок от представителей профессии Data Scientist. Беседовал Андрей Мирошниченко — координатор офлайн-программы «Data Scientist».

О перспективности профессии data science рассказала Александра Головина («Авито»).

На каком этапе, на ваш взгляд, находится рынок data science? Он растёт, достаточно развит или вообще идёт на спад, и через полгода люди, которые учились, поймут, что зря потратили время?

Потребность в специалистах data science очень велика и в дальнейшем будет расти. Однако возможностей для обучения тоже много: любой человек, который понимает, что ему не хватает академического образования, может пройти курсы и получить необходимую базу.

Вопрос, скорее, в том, кто и почему приходит в профессию. Сейчас довольно много людей, которым интересна область больших данных и которые её изучают, но пока не понимают, для чего на самом деле им это нужно. На собеседовании соискатели говорят, что интересуются машинным обучением, а когда начинаешь спрашивать почему, отвечают: «Это модно». И всё. Понимания, как применить знания, нет. То есть в большинстве случаев это исследование ради исследования, попытка апробировать собственные гипотезы.

А в бизнесе все не так. Здесь есть задача, для которой необходимо найти оптимальный метод решения. Специфика в том, чтобы это решение было практически реализуемо. И это, наверное, основная проблема, с которой мы сталкиваемся при отборе людей. Некоторые соискатели считают, что достаточно придумать красивый алгоритм, а то, что его нельзя будет нигде применить — дело десятое. То есть проблема в том, что изучают data science многие, но где и для чего применить данные, понимают далеко не все.

Экспертизу, в свою очередь, можно разделить. Есть люди, которые проработали в близкой нам сфере — классифайдах, IT. Они прекрасно понимают, где и как применять знания. Люди, которые приходят из другой сферы — из банков, вчерашние выпускники или проработавшие в лаборатории — в этом плане проигрывают, но для нас это не показатель. Такие кандидаты могут не знать специфику нашего бизнеса, но способны разработать вполне рабочие алгоритмы, не усложняя поставленную задачу. Это, кстати, вторая проблема кандидатов. Они уходят в deep learning, глубинные сети, пытаются найти что-то посложнее. Хотя на самом деле модель, которая будет работать, может быть намного проще.

Часто встречал в России и за рубежом наименования вакансий в сфере data science с примерно аналогичными обязанностями различаются. Где-то это был инженер machine learning, где-то data scientist, где-то аналитик данных, где-то программист. Так как же называются вакансии такого рода?

Единого названия нет. Это могут быть и широкие названия, типа Старший Аналитик, и более конкретные, например, Аналитик по ценообразованию. Все зависит от того, насколько специфичны предполагаемые задачи и как долго мы предполагаем, что человек их будет решать, прежде чем переключится на другие.

Как правило, когда я общаюсь с кандидатами, то подробно рассказываю про отдел, куда мы ищем человека, про его специфику. Потому что data scientist data scientist’у рознь. В разных компаниях у него разная функциональность, и лучше сразу уточнить, чем предстоит заниматься.

Также на вопросы ответил представитель HR-агентства «Spice IT».

На какой стадии этот сегмент рынка? Ждать ли в ближайшей перспективе спада?

Вакансий все больше и больше. Данные — самый ценный на рынке продукт. Спада в ближайшее время не будет. Специалистов уже не хватает, особенно если речь идет о таких вакансиях, как Head of Predictive Analytics или Lead/Chief data scientist. Кандидаты заняты на серьезных проектах и не хотят бросать начатое. Плюс эти позиции подразумевают наличие специальных качеств, необходимых той или иной компании.

Со стажерами и джунами проще. Data science начинает набирать обороты, и многие рады попробовать свои силы в этой сфере. Ребята сами присылают нам резюме с просьбой рассмотреть их на имеющиеся позиции. Мы только за.

Думаю, через пару лет Data science станет одной из лидирующих вакансий, рынок будет переполнен предложениями, но вот хватит ли на всех кандидатов…

Какие профессиональные компетенции ищете? Какая должна быть база?

Профессиональные компетенции зависят от требований, выставляемых компанией-заказчиком. Из основного можно выделить: R, Python, Machine Learning, базы данных, такие как MSSQL, MySQL, Postgresql. Кандидаты на позицию Data Scientists должны хорошо разбираться в математике, статистике и программировании.

Ссылки:

Полностью материал читайте в блоге «Нетологии» (19 января): Кто такой Data Scientist — глазами работодателя. Интервью с Авито и Spice IT

«Нетология». Программа «Data Scientist» 1 марта — 25 августа, в Москве, 3 занятия в неделю. Базовые алгоритмы и понятия машинного обучения. Feature engineering. Рекомендательные системы. Обработка естественного языка. Машинное зрение. Временные ряды, прогнозирование стоимости товаров. Общение с заказчиком. Дополнительные инструменты и среды data science.