Вообще все курсы Хекслета бесплатные! Но только до 15 декабря. Всё, что нужно → принять вызов

DevOps Инженер (K8S администратор)⚡

Местоположение и тип занятости

Москва, Санкт-Петербург, КалининградПолный рабочий деньМожно удаленно

Компания

Международная компания, специализирующаяся на консалтинге, технологических услугах и аутсорсинге

Описание вакансии

О компании и команде

📌О проекте:

Machine Learning (ML) платформа разработки – платформа, предназначенная для обеспечения полного MLOps цикла разработки моделей. Платформа предоставляет пользователям Data Scientists среду разработки с необходимыми окружением и инструментами, преднастроенными фреймворками анализа, обработки данных, мониторинга и прочими крутыми штуками.

Ищем DevOps-инженера на проект построения ML платформы на базе Kubernetes кластера и новейших технологий с проектированием отказоустойчивой архитектуры масштабируемых сервисов и их компонентов с нуля.

📌Наш стек:

  • Runtime: Kubernetes (self-hosted), Airflow, Spark, Hadoop (HDFS, YARN, Spark, Hive), Seldon, Kubeflow
  • БД и очереди: HDFS, PotgreSQL, Kafka
  • Управление инфраструктурой: Ansible, ArgoCD
  • CICD: Bitbucket, Teamcity, Nexus
  • Мониторинг: Grafana/Zabbix


Ожидания от кандидата

📌Мы ожидаем, что ты имеешь следующий опыт работы:

  • Опыт администрирования OC Linux (RHEL, CentOS) от 2-х лет;
  • Глубокие знания Kubernetes (k8s), самостоятельное разворачивание и обновления в закрытом контуре;
  • Опыт работы с GPU;
  • Опыт построения CI/CD pipelines;
  • Опыт использования скриптов для автоматизации (Python/Bash);
  • Опыт эксплуатации систем мониторинга (Prometeus, Grafana, Zabbix, ELK

📌 Задачи:

  • Проектирование, разработка и эксплуатация новой ML платформы на базе Kubernetes;
  • Разворачивание, развитие, поддержка работоспособности и отказоустойчивости сервисов и компонентов ML платформы (Jupyterhub, Kubeflow, и др.);
  • Создание и настройка CICD сборки и развертывания приложений;
  • Настройка мониторингов инфраструктуры и сервисов;
  • Проведение RnD, изучение нового open-source ПО

Условия работы

удаленно по РФ