Team Lead data scientist

19 апреля 2021

Требования

Менеджмент, Ведущий (Lead) • Python • SQL • Apache Spark • Oracle • Apache Hadoop

Местоположение и тип занятости

Москва • Полный рабочий день • Можно удаленно

Компания

МегаФон

Мы создаем будущее, доступное каждому, используя современные стеки технологий и анализ больших данных

Описание вакансии

Условия работы

Основные направления:

Развитие абонентов: рекомендации телеком продуктов (тарифы, пакеты интернета и т.д.) и различных цифровых сервисов (МФ ТВ, МФ Музыка);
Продвижение кредитно-платежных продуктов (продукты кредитные продукты, рисковые скоринги, автоплатежи и т.д.);
Сохранение абонентской базы, в том числе задача сокращение оттока и анализа его причин;
Геоаналитика и проекты для Ритейла (например, предсказание для полигонов на карте коммерческих показателей салонов связи нашей ритейл сети);
Текстовая и речевая аналитика, развитие чат-бота;
MLOps и конвейер по автоматизации процесса разработки и развертывания моделей в продуктивной среде моделей
Развитие AutoML – системы для автоматического обучения модели в продуктивной среде без участия аналитика

Мы используем:

Python (Scikit-learn, XGBoost/LightGBM/Catboost, PyTorch/TensorFlow, Rasa, fastText, LightFM etc) Cloudera Hadoop (Hive, Spark etc), Oracle Exadata (SQL, PL/SQL), Airflow, MLflow, DVC, Linux, bash, Git.

Вашими задачами будут:

Постановка задач команде аналитиков (в команду могут входить дата-сайнтисты, дата-инженеры, бизнес-аналитики) и обеспечение качества разработанных ML продуктов;
Планирование и соблюдение сроков по разработке ML продуктов;
Экспертная поддержка и развитие data science команды (3-5 человек);
Анализ данных, проверка гипотез и разработка моделей машинного обучения по предсказанию клиентских предпочтений, поведения абонентов, прогноза спроса и трафика, удовлетворенности клиентов и других событий, определение которых приносит пользу нашей Компании и нашим абонентам;
Написание production-ready кода для быстрого деплоя пайплайна с моделью на регулярную эксплуатацию;
Исполнение DS командой технологических процессов (версионирование, документация, code review и т.д.) в соответствии с принятыми в подразделении регламентами и SLA;
Оценка эффективности реализованных проектов (как технической, так и экономической), оценка потенциала проектов в процессе разработки;
Поиск новых технологий и методов, отслеживание трендов и внедрение их в рабочий процесс и проекты.

Мы ожидаем от вас:

Фундаментальные знания в области математики, теории вероятности, мат. статистики (высшее образование, наличие ученой степени будет дополнительным плюсом);
Наличие успешно завершенных проектов с использованием технологий анализа данных и машинного обучения;
Знание алгоритмов машинного обучения, принципов их работы, ключевых особенностей и ограничений;
Отличное владение инструментами анализа данных, библиотеками машинного обучения Python, Hadoop, SQL;
Опыт работы в области Data Science от двух лет. Кандидатов с опытом управления Data science командой от полугода рассмотрим в первую.

Условия:

Возможность работать с самым большим объемом данных в России;
Внешнее и внутреннее обучение за счет компании (Coursera, New Prolab, BigData Team, GeekBrains и др.);
Компенсация затрат на мобильную связь;
ДМС (включая стоматологию), страхование при выезде заграницу;
Частичная компенсация спорта;
Возможность участия в корпоративных спортивных командах: футбол, волейбол, баскетбол, хоккей и бег;
Регулярные митапы онлайн и в офисе с внешними спикерами из разных областей;
До 1 июня работаем удаленно;
Офис в центре: м. Маяковская/Новослободская/Чеховская.