⭐️ Бэкендеры, с какой командой у вас мэтч? Проверяйте на Вайб-чеке → vibe.habr.com

Инженер L3 / SRE

Местоположение и тип занятости

МоскваПолный рабочий деньМожно удаленно

Компания

IT-компания в сфере облачных и AI-технологий

Описание вакансии

О компании и команде

Cloud.ru — провайдер облачных технологий. Один из лидеров рынка облачных сервисов по моделям IaaS и PaaS для физлиц, стартапов, малого, среднего, крупного бизнеса и корпораций.

Сейчас мы ищем Инженера L3 / SRE в команду Платформы Evolution

Ожидания от кандидата

Вы нам подходите, если вы:

  • Имеете опыт работы в качестве DevOps/SRE не менее 2-х лет;
  • Понимаете устройство ядра Linux, его модулей, а также процессов управления потоками, задачами, памятью;
  • Имеете опыт работы с Docker;
  • Имеете опыт работы с libvirt/qemu;
  • Пишете на Python/Bash на уровне Junior+;
  • Хорошо ориентируетесь в сборе метрик процессов, обработке логов и настройке алертинга, желательный стэк: Prometheus, Grafana, ELK/EFK;
  • Имеете опыт работы с различными opensource-системами;
  • Имеете хорошие знания в области сетевых технологий.

Будет плюсом, если вы:

  • Проектировали высоко-нагруженные, масштабируемые и отказоустойчивые сервисы (монолитные или микросервисные);
  • Обладаете знаниями в архитектуре OpenStack и имеете успешный опыт деплоя и эксплуатации платформы;
  • Знаете и умеете использовать Terraform и Ansible;
  • Имеете опыт работы с K8s;
  • Имеете опыт работы с openvswitch;
  • Имеете желание развивать свои профессиональные умения и накапливать опыт.

Задачи:

  • Отвечать за доступность IaaS-платформы и развернутых на ней приложений, оперативно устранять инфраструктурные инциденты;
  • Обеспечивать обновление платформы, весь деплой должен быть покрыт тестами с возможностью отката всех внесенных изменений;
  • Организовать качественный мониторинг и алертинг инфраструктуры и приложений;
  • Быть активным участником процессов инцидент и проблем менеджмента (включая участие в устранении аварий, стабилизации систем после дизастера и выполнения действий, запланированных в рамках постмортема), выполненять работы по запросам пользователей;
  • Планировать и выполнять работы по запросам на изменение, а также регламентных работ направленных на предотвращение угроз деградации/прерывания сервисов;
  • Осуществлять контроль доступных мощностей, подготавливать предложения по увеличению мощностей;
  • Участвовать в проектах, внедрять, согласовывать и актуализировать эксплуатационную документацию;
  • Подготавливать технические требования в случаях необходимости модернизации инфраструктуры;
  • Проводить DR тесты согласно DRP, согласовывать изменения Продукта (изменение архитектуры, дизайна, масштабирование), оценивать риски и целесообразность изменений.

Условия работы

Работа в Cloud.ru — это:

Комфортная среда

  • Оформление в соответствии с трудовым законодательством РФ;
  • Достойный уровень дохода: оклад + годовой бонус;
  • Расширенный ДМС со стоматологией;
  • Компенсация спорта;
  • Штатный терапевт и психолог;
  • Гибкий график работы, пятница – сокращенный рабочий день;
  • Классный офис в Москве;
  • Культура, в основе которой эмпатия, уважение, открытость и свобода строить рабочий процесс так, как считаешь нужным.

Место, где ты растешь

  • Индивидуальный план развития и обучение за счет компании;
  • Возможность вертикального и горизонтального роста;
  • Возможность развиваться как эксперту: выступать на мероприятиях, писать статьи.

Крутая команда

  • Профессиональные сообщества и клубы по интересам;
  • Неформальные мероприятия: от футбольного клуба до посиделок с пиццей.

Еще у нас

  • Льготная программа ипотечного и потребительского кредитования;
  • Материальная помощь при рождении детей и других семейных обстоятельствах;
  • Бонусы за рекомендации кандидатов на открытые вакансии.