📢 Занимаетесь брендом работодателя?

Приходите 11 марта на Хабр Семинар, поговорим о том, как бренд и коммуникации становятся частью стратегии удержания.

→ Узнать больше

Team Lead data scientist

Требования

Менеджмент
Lead
Python
SQL
Apache Spark
Oracle
Apache Hadoop

Условия

Можно удалённо
Москва

Компания

Мы создаем будущее, доступное каждому, используя современный стек технологий

Описание вакансии

Основные направления:

  • Развитие абонентов: рекомендации телеком продуктов (тарифы, пакеты интернета и т.д.) и различных цифровых сервисов (МФ ТВ, МФ Музыка);
  • Продвижение кредитно-платежных продуктов (продукты кредитные продукты, рисковые скоринги, автоплатежи и т.д.);
  • Сохранение абонентской базы, в том числе задача сокращение оттока и анализа его причин;
  • Геоаналитика и проекты для Ритейла (например, предсказание для полигонов на карте коммерческих показателей салонов связи нашей ритейл сети);
  • Текстовая и речевая аналитика, развитие чат-бота;
  • MLOps и конвейер по автоматизации процесса разработки и развертывания моделей в продуктивной среде моделей
  • Развитие AutoML – системы для автоматического обучения модели в продуктивной среде без участия аналитика

Мы используем:

Python (Scikit-learn, XGBoost/LightGBM/Catboost, PyTorch/TensorFlow, Rasa, fastText, LightFM etc) Cloudera Hadoop (Hive, Spark etc), Oracle Exadata (SQL, PL/SQL), Airflow, MLflow, DVC, Linux, bash, Git.

Вашими задачами будут:

  • Постановка задач команде аналитиков (в команду могут входить дата-сайнтисты, дата-инженеры, бизнес-аналитики) и обеспечение качества разработанных ML продуктов;
  • Планирование и соблюдение сроков по разработке ML продуктов;
  • Экспертная поддержка и развитие data science команды (3-5 человек);
  • Анализ данных, проверка гипотез и разработка моделей машинного обучения по предсказанию клиентских предпочтений, поведения абонентов, прогноза спроса и трафика, удовлетворенности клиентов и других событий, определение которых приносит пользу нашей Компании и нашим абонентам;
  • Написание production-ready кода для быстрого деплоя пайплайна с моделью на регулярную эксплуатацию;
  • Исполнение DS командой технологических процессов (версионирование, документация, code review и т.д.) в соответствии с принятыми в подразделении регламентами и SLA;
  • Оценка эффективности реализованных проектов (как технической, так и экономической), оценка потенциала проектов в процессе разработки;
  • Поиск новых технологий и методов, отслеживание трендов и внедрение их в рабочий процесс и проекты.

Мы ожидаем от вас:

  • Фундаментальные знания в области математики, теории вероятности, мат. статистики (высшее образование, наличие ученой степени будет дополнительным плюсом);
  • Наличие успешно завершенных проектов с использованием технологий анализа данных и машинного обучения;
  • Знание алгоритмов машинного обучения, принципов их работы, ключевых особенностей и ограничений;
  • Отличное владение инструментами анализа данных, библиотеками машинного обучения Python, Hadoop, SQL;
  • Опыт работы в области Data Science от двух лет. Кандидатов с опытом управления Data science командой от полугода рассмотрим в первую.

Условия:

  • Возможность работать с самым большим объемом данных в России;
  • Внешнее и внутреннее обучение за счет компании (Coursera, New Prolab, BigData Team, GeekBrains и др.);
  • Компенсация затрат на мобильную связь;
  • ДМС (включая стоматологию), страхование при выезде заграницу;
  • Частичная компенсация спорта;
  • Возможность участия в корпоративных спортивных командах: футбол, волейбол, баскетбол, хоккей и бег;
  • Регулярные митапы онлайн и в офисе с внешними спикерами из разных областей;
  • До 1 июня работаем удаленно;
  • Офис в центре: м. Маяковская/Новослободская/Чеховская.