Инженер L3 / SRE
Требования
Местоположение и тип занятости
Компания
IT-компания в сфере облачных и AI-технологий
Описание вакансии
О компании и команде
Cloud.ru — провайдер облачных технологий. Один из лидеров рынка облачных сервисов по моделям IaaS и PaaS для физлиц, стартапов, малого, среднего, крупного бизнеса и корпораций.
Сейчас мы ищем Инженера L3 / SRE в команду Платформы Evolution
Ожидания от кандидата
Вы нам подходите, если вы:
- Имеете опыт работы в качестве DevOps/SRE не менее 2-х лет;
- Понимаете устройство ядра Linux, его модулей, а также процессов управления потоками, задачами, памятью;
- Имеете опыт работы с Docker;
- Имеете опыт работы с libvirt/qemu;
- Пишете на Python/Bash на уровне Junior+;
- Хорошо ориентируетесь в сборе метрик процессов, обработке логов и настройке алертинга, желательный стэк: Prometheus, Grafana, ELK/EFK;
- Имеете опыт работы с различными opensource-системами;
- Имеете хорошие знания в области сетевых технологий.
Будет плюсом, если вы:
- Проектировали высоко-нагруженные, масштабируемые и отказоустойчивые сервисы (монолитные или микросервисные);
- Обладаете знаниями в архитектуре OpenStack и имеете успешный опыт деплоя и эксплуатации платформы;
- Знаете и умеете использовать Terraform и Ansible;
- Имеете опыт работы с K8s;
- Имеете опыт работы с openvswitch;
- Имеете желание развивать свои профессиональные умения и накапливать опыт.
Задачи:
- Отвечать за доступность IaaS-платформы и развернутых на ней приложений, оперативно устранять инфраструктурные инциденты;
- Обеспечивать обновление платформы, весь деплой должен быть покрыт тестами с возможностью отката всех внесенных изменений;
- Организовать качественный мониторинг и алертинг инфраструктуры и приложений;
- Быть активным участником процессов инцидент и проблем менеджмента (включая участие в устранении аварий, стабилизации систем после дизастера и выполнения действий, запланированных в рамках постмортема), выполненять работы по запросам пользователей;
- Планировать и выполнять работы по запросам на изменение, а также регламентных работ направленных на предотвращение угроз деградации/прерывания сервисов;
- Осуществлять контроль доступных мощностей, подготавливать предложения по увеличению мощностей;
- Участвовать в проектах, внедрять, согласовывать и актуализировать эксплуатационную документацию;
- Подготавливать технические требования в случаях необходимости модернизации инфраструктуры;
- Проводить DR тесты согласно DRP, согласовывать изменения Продукта (изменение архитектуры, дизайна, масштабирование), оценивать риски и целесообразность изменений.
Условия работы
Работа в Cloud.ru — это:
Комфортная среда
- Оформление в соответствии с трудовым законодательством РФ;
- Достойный уровень дохода: оклад + годовой бонус;
- Расширенный ДМС со стоматологией;
- Компенсация спорта;
- Штатный терапевт и психолог;
- Гибкий график работы, пятница – сокращенный рабочий день;
- Классный офис в Москве;
- Культура, в основе которой эмпатия, уважение, открытость и свобода строить рабочий процесс так, как считаешь нужным.
Место, где ты растешь
- Индивидуальный план развития и обучение за счет компании;
- Возможность вертикального и горизонтального роста;
- Возможность развиваться как эксперту: выступать на мероприятиях, писать статьи.
Крутая команда
- Профессиональные сообщества и клубы по интересам;
- Неформальные мероприятия: от футбольного клуба до посиделок с пиццей.
Еще у нас
- Льготная программа ипотечного и потребительского кредитования;
- Материальная помощь при рождении детей и других семейных обстоятельствах;
- Бонусы за рекомендации кандидатов на открытые вакансии.