Хакатон «Газпром-медиа» по анализу больших данных Hack the Media, 7-8 апреля, Москва

Хакатон «Газпром-медиа» по анализу больших данных Hack the Media, 7-8 апреля, Москва

«Газпром-медиа» проведёт хакатон по обработке и анализу больших данных с призовым фондом 500 тысяч рублей. Цель хакатона — поиск новых решений в сфере цифровых медиа для сегмента развлекательного телевидения. Заявки на участие принимаются до 27 марта.

Компания «Газпром-Медиа Развлекательное телевидение» владеет множеством медийных активов, включая телеканалы ТНТ, ТНТ4, 2х2, Пятница, Матч, ТВ3 и сайты каналов, интернет-площадки, мобильные игры и приложения, а также группы в социальных сетях. Компания накопила огромный массив как структурированных, так и неструктурированных данных, многие из которых успешно применяет для улучшения своего бизнеса, однако открыта к поиску новых точек роста с использованием Big Data.

«Газпром-медиа» интересны пять направлений по созданию алгоритмов (но участники могут предложить собственные идеи и темы):

  • новые рекламные технологии и управление интегрированными кампаниями;
  • измерения аудитории и выделение трендов;
  • аналитика потокового видео;
  • рекомендательные сервисы, повышающие конверсию и улучшающие пользовательский опыт;
  • автоматическая разметка видео (описание сюжета, актеров, событий и так далее).

В финале участники конкурса должны описать цели и задачи проекта, целевую аудиторию и рыночные перспективы, а также продемонстрировать минимально жизнеспособный продукт (MVP) и исходный код.
Примеры выполненных заданий на финале: алгоритм предсказания покупки подписки пользователем, алгоритм рекомендательной системы контента и алгоритм предсказания успешности контента на основе исторических данных.

Для разработки решений медиахолдинг предоставит финалистам наборы обезличенных данных:

  • Просмотры видео группы РТВ на Rutube
    Датасет содержит логи просмотров пользователями видео группы каналов РТВ на Rutube, включая cookie, данные о местоположении пользователя, его User-Agent, Referer и т.д.
  • Сессии просмотров эфира ТНТ в ОТТ
    Датасет содержит логи просмотров стрима телеканала ТНТ в ОТТ-сервисах с разбивками на программы в эфире, включая уникальный id сессии, геолокацию, IP, User-Agent.
  • Сырые данные счётчика Mediascope Heartbeat
    Датасет содержит сырые логи вызова счётчика MediascopeHeartbeat, который вызывается каждые 30 секунд при просмотре видео, передавая данные о просматриваемом контенте, точном времени на устройстве пользователя, на сервере и в просматриваемом контенте, о версии этого контента, о типе устройства и т.д., а также содержит каталог контента, просмотр которого зафиксирован в логах.

Критерии оценки решений:

  • Масштабируемость решения
  • Сложность его интеграции
  • Коммерческий потенциал

Заявки на участие в хакатоне принимаются до 27 марта, финалистов жюри определит 30 марта. Финал пройдёт 7-8 апреля в московском Центре блокчейн-компетенций.
Заявка на участие может быть коллективной или индивидуальной. Тем, кто подал индивидуальную заявку, организатор хакатона помогает сформировать команду. В финал проходят команды из 3-4 человек, среди которых могут быть разработчики, аналитики и Data Scientist.

По итогам соревнований жюри определит трёх победителей. Приз за первое место — 250 тысяч рублей, за второе — 150 тысяч рублей, за третье — 100 тысяч рублей.

Сайт хакатона: https://hackthemedia.ru/

Место проведения: Москва, 2-й Донской проезд, д. 9