Инженер сопровождения инфраструктуры L3 (SRE)
Требования
Местоположение и тип занятости
Компания
Описание вакансии
О компании и команде
Мы делаем ИТ для ритейла реального времени.
Наши ИТ-продукты автоматизируют разные этапы цепочки создания ценности для клиента доставки: закупки, логистику, работу дарксторов, сборку и доставку заказа до двери, управление промокампаниями и остальные этапы большого процесса. Используем интеллектуальные системы прогнозирования, а разные этапы выполнения заказа автоматизируем роботическими системами.
Наши ключевые направления: Быстрая доставка, Маркетплейс, Логистика.
Наша цель — сделать все необходимые ИТ-инструменты и инфраструктуру, чтобы все нужные товары могли попадать домой к людям мгновенно (насколько это возможно в физическом мире).
Мы ищем инженера сопровождения в команду Observability & Reliability. Команда отвечает за стабильность работы наших сервисов.
Ожидания от кандидата
- Поддержка, анализ и частично внедрение процессов и инструментов для обеспечения высокой доступности и производительности систем;
- Работа с алертами. Установление причины возникновения алерта, при возможности устранение алерта. Действовать согласно ранбукам и инструкциям, разработка инструкций по алертам.
- Реагирование на инциденты, оперативно их решать, опираясь на компетенции и инструкции, по необходимости эскалировать проблему команде эксплуатации или разработчикам;
- Разработка и поддержка актуальность документации: регламентов, инструкций, FAQ и пр.;
- Диагностика и помощь в решении проблем возникающий у разработчиков. Привлечение профильных команд эксплуатации, в целях решения проблемы;
- Работа с логами (уметь работать с маппингом в стеке ELK);
- Работа с метриками (grafana). Создание и работа с dashboard, alerts, notification policies, silences и др. Создание дашбордов, триггеров, хостгрупп, сайлентсов и пр. (zabbix).
От успешного соискателя мы ожиданием:
- Базовых знаний или опыта работы с системами логирования и трассировки логов (например: ELK stack, Graylog, Logstash, etc.);
- Базовых знаний или опыта работы с инструментами мониторинга (например: Prometheus, Grafana, Zabbix, VictoriaMetrics, etc.);
- Опыта работы с Linux-based операционными системами на уровне системного администратора (чтение и парсинг логов, регулярные выражения, понимание процессов на уровне файловой системы);
- Знание стека TCP/IP.
Будет плюсом:
- Опыт работы с инструментами Atlassian, такими как Jira/Confluence;
- Базовые знания или опыт работы с такими инструментами как Sentry, Tempo, APM, Docker, Kubernetes, Helm, Vault, Kafka, Clickhouse, Ansible, Gitlab/Gitlab CI, etc.;
- Базовые знания опыт работы с базами данных (например PostgreSQL, MongoDB, MySQL, ClickHouse, Couchbase, etc.);
- Опыт написания одного из скриптового языка программирования (Bash, Python, Go).
Условия работы
Все классические условия, с запасом
Мы аккредитованная IT-компания с сопутствующими преимуществами. У нас белая зарплата, ДМС и страховка, разнообразное обучение, оплата участия в конференциях, скидки от партнеров и все классические плюшки.
Вайб
- Делаем продукты – понятные, оставляющие след в реальном мире, помогающие создавать клиентский опыт, которым пользуемся сами. Круассан из Самоката, наушники из Мегамаркета с доставкой по клику – с помощью наших решений.
- Считаем, что не знать, как правильно и пробовать – это ок. Умеем ошибаться, учиться на ошибках, развиваться.
- Работаем откуда угодно в России.
- Ценим простоту общения. Чтобы можно было задать вопрос любому коллеге (от самого главного босса до вообще любого человека из любой команды), получить прямой ответ.
- По умолчанию на “ты”. Уважаем коллег, стремимся к дружелюбию и доброжелательности. Не приемлем токсичность ни при каких обстоятельствах.
- Умеем меняться – пересобирать оргструктуру, менять подходы к разработке, обновлять продуктовый и технологический фокус – быть стабильными в росте, не разваливаться, избегать неповоротливости.
- Мы большие и разные: в технологиях, подходах, людях. Найдёшь у нас коллег, близких по духу и интересам.