DevOps-инженер
Требования
Местоположение и тип занятости
Компания
Создаем передовые IT-решения для металлургической отрасли
Описание вакансии
Условия работы
Группа НЛМК — крупнейший в России и один из самых эффективных в мире производителей стальной продукции. Производственные активы в России, Европе, Азии и США.
Мы ищем SRE-инженера по направлению обеспечение надежности систем.
На текущий момент создается отдел по сопровождению MES-систем предприятия.
Ключевые задачи:
- Обеспечение необходимого уровня надежности и производительности информационных систем в зоне ответственности команды в соответствии с требованиями к их доступности (SLA);
- Поддержание баланса между скоростью внесения изменений и стабильностью работы;
- Развитие и сопровождение сред разработки;
- Моделирование поведения системы при отказе различных компонентов и проработка механизмов обеспечения ее отказоустойчивости;
- Развертывание, конфигурирование и администрирование компонентов приложений
- Построение CI/CD процесса;
- Настройка резервного копирования данных;
- Проведение работ по тестированию восстановления работоспособности информационной системы и ее данных на периодической основе;
- Настройка сбора диагностических данных и метрик, мониторинга, включая проверку доступности бизнес-функционала;
- Решение инцидентов, анализ корневых причин.
Для нас важно:
- Знание и практический опыт администрирования Linux-систем от 3-х лет
- Опыт использования систем версионирования кода (Gitlab), хранилищ артефактов (Nexus / Artifactory)
- Знание и опыт использования инструментов автоматизации CI/CD: Gitlab CI / Jenkins; управления конфигурацией Ansible.
- Опыт работы с платформой оркестрации контейнеров (Kubernetes / OpenShift)
- Опыт работы с приложениями, запущенными в виде контейнеров (Docker), в том числе на платформах оркестрации (Kubernetes / OpenShift / OKD) + Helm
- Системами мониторинга и сбора диагностических данных:
- ELK
- Grafana, Prometheus
- Sentry
- Jaeger
- Навыки написания скриптов на Bash / Python / Go
- Практический опыт развертывания и администрирования как минимум нескольких решений из списка:
- PostgreSQL / Cassandra
- Nginx, HAProxy
- Практический опыт работы со следующим ПО
- NiFi
- Kafka, RabbitMQ, Redis
- Траблшутинг проблем в микро-сервисной архитектуре
- Будет преимуществом:
- Опыт развертывания и администрирования:
- Clickhouse
- MiniO
- HashiCorp Vault
- Написание кода на Java / Python / Go.
Условия работы:
- Удалённый формат работы.
- Конкурентный уровень заработной платы и ежегодная индексация.
- Корпоративные льготы: ДМС, льготное страхование родственников, банковские продукты сотрудникам и скидки партнеров.
- Обучение и развитие: английский язык в лучших языковых школах, большое количество обучающих курсов от внутреннего корпоративного университета, посещение митапов и конференций.
- Возможность принять участие в интересных и сложных проектах с лучшими специалистами индустрии.