Data Scientist / ML-инженер (Big Data)
Зарплата
Требования
Местоположение и тип занятости
Компания
Описание вакансии
Условия работы
Big Data МТС – место, где телеком данные превращаются в реально работающие IT-продукты. Мы создали и протестировали несколько десятков сервисов. Самые успешные из них уже стали частью экосистемы МТС. Например, МТС Маркетолог, рекомендации в KION (МТС ТВ), услуга “Кто звонит?” или Спам blacklist.
Кого мы ищем?
Обязательно:
- опыт работы от 2 лет в области анализа данных и машинного обучения
- вы знаете, как работают ML-алгоритмы и не будете тратить время на эксперименты с заведомо плохими решениями
- понимаете, когда нужно остановиться и использовать вместо ML более простые и быстрые подходы
- у вас продвинутые знания Python, в т.ч. основных ml-библиотек
- умеете делать препроцессинг данных на SQL или PySpark
- умеете работать с git
- есть базовые навыки работы в Linux/Unix
Желательно:
- знаете минимум один из классических языков C, Java, Scala, C/C++/C# и есть опыт программирования в прошлом
- есть опыт вывода ml-решений в продакшн
Что предстоит делать?
- выгружать и готовить/обрабатывать данные (находить аномалии и инсайты)
- перебирать гиперпараметры ml-моделей, пока кросс-валидация не даст нормальный результат :)
- дорабатывать ml-модели из стандартных библиотек
- проверять бизнес гипотезы в offline и готовить дизайн A/B тестов
- доводить модель до прода совместно с разработчиками
Сейчас мы ищем Data Scientist’ов и ML-инженеров в следующие проекты:
- Финтех: на лидогенерацию и next best action для МТС Банка
- Анализ временных рядов, антифрод
- Анализ геоданных
Что вы найдете в команде Big Data?
Стек технологий:
- работаем с данными на классическом hadoop-стеке (Spark, Hive)
- разрабатываем на python3: R&D делаем в Jupyter, продуктивизируем в PyCharm
- обучаем модели на отдельных мощных машинах с видеокартами Tesla V100
- используем собственные разработки для скоринга больших данных и MLFlow для экспериментов
- храним код в gitlab, CI/CD в Jenkins, процессы запускаем в Airflow
- управляем задачами в Jira, документация в Confluence/Gitlab wiki
Команда: в команде Data Science сейчас 30 человек (во всей Big Data МТС более 300 человек). Все DS поделены на группы со своими лидами - есть группа рекомендательных систем, скоринга и другие. Каждую неделю мы обмениваемся опытом на совместных синках.
DS работают в продуктах со своей автономной командой, в которой есть все роли: аналитики, DE, DS, разработчики, девопсы, менеджеры продукта.
Есть ли обучение?
- Локальные и международные конференции, митапы.
- Корпоративный университет МТС и масштабная виртуальная библиотека.
- А ещё мы регулярно обмениваемся опытом на совместных синках с лидами экспертизы
Какой график? Гибкое начало рабочего дня в промежутке с 8 до 11. Есть возможность работать несколько дней вне офиса по договоренности с командой.
Бонусы
Условия:
каждый месяц - аванс и зарплата, дважды в год - премия. ДМС + стоматология, корпоративная связь, специальные предложения от партнеров и друзей МТС, отпуск 31 день в год. Выдаем 16” MacBook Pro или Dell на выбор.
Дополнительные инструкции
Сколько этапов при отборе? Не более трех:
- HR + первое тех. интервью с лидом направления
- Тестовое задание/второе интервью - по необходимости
- Собеседование с PO и командой, выбор кандидатом проекта