Senior MLOps-инженер

Зарплата

от 260 000 до 380 000 ₽

Местоположение и тип занятости

МоскваПолный рабочий деньМожно удаленно

Компания

Разработка ПО, анализ данных и машинное обучение

Описание вакансии

О компании и команде

Мы в Rubbles занимаемся разработкой и внедрением DS-продуктов в крупные бизнесы. Например, системами предсказания спроса на товары в ритейле и FMCG, рекомендательными системами, системами предсказания поломок оборудования, поисковыми системами для онлайн-магазинов, системами оптимизации производства в промышленности, цифровые двойники и многим другим. Алгоритмы Rubbles ежедневно улучшают работу крупнейших банков, ритейл-сетей, нефтегазовых компаний и других предприятий.

Мы разрабатываем MLOps-платформы, которые предназначены для продуктивизации ML-моделей. Типичная платформа включает себя:

  1. Рабочее место DS/DA/DE
  2. Хранилище моделей
  3. Фичестор
  4. Решение для сервинга моделей
  5. Пайплайны и их автоматизация
  6. Мониторинг и логирование

Эти компоненты чаще всего построены на базе открытых решений, например Hadoop/Spark, Terraform, Ansible, JupyterLab, MLFlow, Feast, Seldon Core, Gitlab CI/CD, Prometheus, Grafana, Loki и т.д.

Мы ищем Senior MLOps-инженера способного проектировать, разрабатывать и поддерживать такие платформы.

Ожидания от кандидата

Обязанности:

  • Участие в построении MLOps-платформ на всех этапах, включая аудит, проектирование, разработку и эксплуатацию.
  • Взаимодействие с бизнесом, формирование беклога задач MLOps-команды.
  • Проработка, распределение задач, проведение код-ревью.
  • Разработка и поддержание в актуальном состоянии документации по процессу и инструментам.
  • Автоматизация процессов обучения, тестирования и доставки моделей в среду исполнения.
  • Взаимодействие с тимлидом команды, выработка решений по стеку проекта, внедрению, модернизации инструментов.
  • Участие во встречах со смежными техническими командами, защита решений, проработка интеграций.
  • Оценка вычислительной и пропускной способности.
  • Нагрузочное и функциональное тестирование.
  • Обеспечение SLA по уровню доступности сервисов.
  • Решение инцидентов и проблем, анализ корневых причин, участие в устранении и расследовании причин сбоев.

На что смотрим:

  • Опыт работы в MLOps-проектах от 3 лет.
  • Опыт работы с инструментами развертывания и оркестрации: Kubernetes, Helm, Terraform, Ansible.
  • Опыт работы с системами мониторинга и логирования: Prometheus, Grafana, Loki.
  • Опыт работы с открытыми решениями, используемыми в MLOps-платформах, такими как Airflow, Hadoop/Spark, MLFlow, Seldon Core.
  • Опыт выработки архитектурных решений и декомпозиции задач.
  • Уверенное знание Python.
  • Опыт построения CI/CD пайплайнов.
  • Опыт разработки REST-сервисов (FastApi, Flask).
  • Знание и практический̆ опыт администрирования linux-систем.
  • Коммуникативные навыки, способность работать, как в команде, так и самостоятельно.

Будет плюсом:

  • Знания по принципам работы ML-моделей и методологии их разработки.
  • Опыт работы с инфраструктурой облачных провайдеров, таких как AWS, Azure, Google Cloud Platform, Я.Облако.
  • Знание Argo-стека: ArgoCD, ArgoWorkflow, ArgoEvents.

Условия работы

У нас:

  • Работа в одной из самых сильных ML команд в России.
  • Участие в росте компании, работающей на перспективном AI рынке.
  • Гибкий график работы, гибкое предоставление отгулов и отпусков.
  • Гибкий формат работы: полная удаленка/гибрид/офис в Москве. Но для данной позиции важно находиться в пределах РФ!
  • Поддержка в профессиональном и карьерном росте, оплата профильного. обучения, конференций и книг, корпоративные скидки на курсы английского.
  • Совместная работа с опытными разработчиками, аналитиками данных, менеджерами, продуктологами.
  • ДМС со стоматологией после испытательного срока (3 месяца) по всей России.
  • При желании работать из офиса – уютный офис в центре Москвы (2 минуты от м. Сухаревская) со всем необходимым для комфортной работы.

Особенно актуальное:

  • Мы аккредитованная ИТ-компания со всеми вытекающими льготами.