Математик-программист в команду DMP

Местоположение и тип занятости

МоскваПолный рабочий день

Компания

Один из лидеров российской индустрии медиа и развлечений

Описание вакансии

Условия работы

В отделе аудиторного сегментирования (DMP) компании Rambler&Co открыта вакансия математика-программиста.

Наш отдел занимается созданием различных продуктов, основанных на обработке больших данных. Создание этих продуктов было бы невозможно без команды машинного обучения, в которую мы ищем математика-программиста.

Задачи, к которым придется подключиться:

  • Платформа DMP позволяет сегментировать аудиторию. Ежедневно обрабатывается порядка 10000 сегментов, заведение и контроль практически всех сегментов не требует участия разработки. Для построения сегментов каждый день обучается и применяется более 1000 моделей (Классификация, Lookalike);
  • Технология сross-device отвечает за склеивание кук пользователей, которые заходят на наши площадки с разных браузеров или устройств (нечёткая склейка на основе линейной регрессии);
  • Прогноз доступного инвентаря - предсказание охвата аудитории наших площадок в различных срезах;
  • Прогноз кинопроката - предсказание аудитории кинотеатров в различных срезах. Этот проект находится на стадии активного развития и состоит из решения двух крупных задач: 1) предсказание числа сеансов и проданных билетов для фильма в будущем, 2) определение фактической аудитории (пол, возраст) пришедшей на сеанс фильма с использованием нейронных сетей.

В компании Rambler&Co накоплена большая экспертиза по решению практических задач с использованием машинного обучения, а также по работе с Big Data. У нас есть действительно большие данные: счетчик Топ100, наши рекламные системы, кинотеатры и внешние поставщики генерируют около 10ТБ логов в день - это миллиарды уникальных событий. Для их обработки мы используем: Hadoop, Hive, Tez, и, в основном, Spark. Большая часть разработки происходит с использования языка Python.

Ключевой особенностью нашей команды является то, что разработчик-математик не концентрируется лишь на аналитике, а имеет возможность довести свои модели до продакшн.

Что мы ожидаем от кандидата:

  • Хорошие знания мат статистики и понимание теории машинного обучения;
  • Практический опыт решения задач по анализу данных;
  • Знание базовых алгоритмов и структур данных;
  • Знание языка Python на базовом уровне;
  • Умение работать в команде, ответственность за результат.

Несомненным плюсом будет:

  • Опыт доведения решений до продакшн;
  • Знание SQL и опыт работы с БД;
  • Опыт работы с большими данными и в частности с экосистемой Hadoop (MapReduce, Hive, Spark, etc).

Бонусы

Мы с радостью предложим:

  • Полное соблюдение ТК РФ;
  • Качественная медицинская страховка;
  • Красивый и удобный офис недалеко от центра Москвы,
  • Регулярные митапы и хакатоны (участие по желанию);
  • Интересная работа среди профессионалов #ВХорошейКомпании;
  • Пинг-понг и настольный футбол;
  • Помощь в релокации для людей из других регионов;
  • Уровень заработной платы по результатам собеседования.