Печеньки, удаленка, обучение — а что на самом деле важно в работе? Поделитесь с нами → в опросник

Инженер по обеспечению доступности систем (SRE)

Местоположение и тип занятости

МоскваПолный рабочий деньМожно удаленно

Компания

IT-компания в сфере облачных и AI-технологий

Описание вакансии

Условия работы

О нас

Департамент инфраструктуры и поддержки ищет Инженеров по обеспечению доступности систем (SRE). Мы обеспечиваем работу тысяч серверов и инфраструктурного ПО для корпоративных и клиентских сервисов компании. Мы верим в концепцию Infrastructure-as-a-Code, а также в то, что инфраструктура имеет огромное значение в успехе продукта.

Мы ищем человека, который сможет войти в продуктовую команду, погрузиться в текущий стек разработки, CI/CD пайплайн, найти общий язык с DevOps командой, организовать деплой кода в прод и обеспечивать его работоспособность.

Вы нам подходите, если вы:

  • имеете опыт работы в качестве DevOps или SRE инженера не менее 3-х лет;
  • понимаете устройство ядра Linux, его модулей, а также процессов управления потоками, задачами, памятью;
  • знакомы с системами виртуализации - VMware ESXi, KVM, Xen;
  • обладаете глубокими знаниями контейнеризации (Docker) и опыт работы с k8s;
  • знаете и имеете практический опыт работы с Git в связке с любым CI/CD;
  • знаете и умеете использовать Terraform и Ansible/Puppet/Chef;
  • пишете на Python на уровне Junior+;
  • хорошо ориентируетесь в сборе метрик процессов, обработке логов и настройке алертинга; желательный стэк: Zabbix, Prometheus, ELK;
  • имеете базовые знания в области сетевых технологий;

Будет плюсом, если вы:

  • проектировали высоко-нагруженные, масштабируемые и отказоустойчивые сервисы (монолитные или микросервисные);
  • умеете читать код на Go на уровне Junior+;
  • обладаете практическим опытом эксплуатации высоконагруженных и распределенных SQL/NoSQL DB;

Вам предстоит:

  • контролировать выпуск в prod нового "кода", весь деплой должен быть покрыт тестами с возможностью отката всех внесенных изменений;
  • организовать качественный мониторинг и алертинг инфраструктуры и приложения;
  • быть активным участником процессов инцидент и проблем менеджмента (включая участие в устранении аварий, стабилизации систем после дизастера и выполнения действий, запланированных в рамках постмортема);
  • проведение DR тестов согласно DRP, псогласование изменений продукта (изменение архитектуры, дизайна, масштабирование), оценка рисков и целесообразности;
  • строгая оценка систем на соответствие Стандарту по архитектурным решениям для внутренних АС и Требованиях к эксплуатации ПО и контроль устранения недоработок, в том числе внесение изменений в системах, находящихся в промышленной эксплуатации.

Что мы предлагаем:

  • Оформление в соответствии с трудовым законодательством РФ;
  • Конкурентный уровень дохода (оклад + годовой бонус);
  • ДМС со стоматологией и возможностью подключения к программе своих детей и родственников;
  • Прозрачную систему мотивации, которая позволяет влиять на уровень дохода;
  • Работу в команде профессионалов;
  • Участие в создании инновационных продуктов;
  • Гибкое начало рабочего дня, пятница - сокращённый рабочий день;
  • Возможность работать удаленно;
  • Офис в центре Москвы;
  • Корпоративную мобильную связь;
  • Льготную программу ипотечного и потребительского кредитования;

Ещё у нас:

  • Возможность вертикального и горизонтального роста;
  • Бонусные программы от компаний партнёров;
  • Возможность получения бонуса за закрытие вакансии по вашей рекомендации;
  • Материальная помощь при рождении детей и др. семейных обстоятельствах;
  • Обучение в Корпоративном университете;
  • Участие в профильных конференциях в качестве спикера или слушателя;
  • Корпоративная жизнь: спортивные комьюнити, клубы по интересам (настолки, интеллектуальные игры;
  • Обучение и развитие в компании.