Математик-программист в команду DMP
Требования
Местоположение и тип занятости
Компания
Описание вакансии
Условия работы
В отделе аудиторного сегментирования (DMP) компании Rambler&Co открыта вакансия математика-программиста.
Наш отдел занимается созданием различных продуктов, основанных на обработке больших данных. Создание этих продуктов было бы невозможно без команды машинного обучения, в которую мы ищем математика-программиста.
Задачи, к которым придется подключиться:
- Платформа DMP позволяет сегментировать аудиторию. Ежедневно обрабатывается порядка 10000 сегментов, заведение и контроль практически всех сегментов не требует участия разработки. Для построения сегментов каждый день обучается и применяется более 1000 моделей (Классификация, Lookalike);
- Технология сross-device отвечает за склеивание кук пользователей, которые заходят на наши площадки с разных браузеров или устройств (нечёткая склейка на основе линейной регрессии);
- Прогноз доступного инвентаря - предсказание охвата аудитории наших площадок в различных срезах;
- Прогноз кинопроката - предсказание аудитории кинотеатров в различных срезах. Этот проект находится на стадии активного развития и состоит из решения двух крупных задач: 1) предсказание числа сеансов и проданных билетов для фильма в будущем, 2) определение фактической аудитории (пол, возраст) пришедшей на сеанс фильма с использованием нейронных сетей.
В компании Rambler&Co накоплена большая экспертиза по решению практических задач с использованием машинного обучения, а также по работе с Big Data. У нас есть действительно большие данные: счетчик Топ100, наши рекламные системы, кинотеатры и внешние поставщики генерируют около 10ТБ логов в день - это миллиарды уникальных событий. Для их обработки мы используем: Hadoop, Hive, Tez, и, в основном, Spark. Большая часть разработки происходит с использования языка Python.
Ключевой особенностью нашей команды является то, что разработчик-математик не концентрируется лишь на аналитике, а имеет возможность довести свои модели до продакшн.
Что мы ожидаем от кандидата:
- Хорошие знания мат статистики и понимание теории машинного обучения;
- Практический опыт решения задач по анализу данных;
- Знание базовых алгоритмов и структур данных;
- Знание языка Python на базовом уровне;
- Умение работать в команде, ответственность за результат.
Несомненным плюсом будет:
- Опыт доведения решений до продакшн;
- Знание SQL и опыт работы с БД;
- Опыт работы с большими данными и в частности с экосистемой Hadoop (MapReduce, Hive, Spark, etc).
Бонусы
Мы с радостью предложим:
- Полное соблюдение ТК РФ;
- Качественная медицинская страховка;
- Красивый и удобный офис недалеко от центра Москвы,
- Регулярные митапы и хакатоны (участие по желанию);
- Интересная работа среди профессионалов #ВХорошейКомпании;
- Пинг-понг и настольный футбол;
- Помощь в релокации для людей из других регионов;
- Уровень заработной платы по результатам собеседования.