Ведущий специалист систем мониторинга (observability-инженер)

23 сентября

Требования

DevOps-инженер, Старший (Senior) • Bash • Linux • Git • Zabbix • Docker • Kubernetes • Grafana • Prometheus • Graylog

Местоположение и тип занятости

Москва, Санкт-Петербург • Полный рабочий день • Можно удаленно

Компания

Честный ЗНАК

Система цифровой маркировки и прослеживания товаров в России и ЕАЭС

Описание вакансии

О компании и команде

Мы создаем единую распределенную систему масштаба страны, которая преобразит опыт совершения покупок, а именно позволит "оцифровать" каждую единицу товара уже к 2025 году.

Это позволит каждому покупателю быть уверенным в качестве и происхождении товара, а производителям и продавцам - не только уменьшить долю неоригинальной продукции на рынке, но и оптимизировать производственно-логистические процессы и сократить издержки за счет возможностей аналитической подсистемы. Уже сейчас система обрабатывает миллиарды транзакций ежедневно и оперирует петабайтами данных на скоростях десятки тысяч запросов в секунду.

О мониторинге:

Сама система мониторинга в настоящее время строится на стеке: Kubernetes, Prometheus + Victoria metrics; Clickhouse; ELK; Graylog; Grafana. Обрабатываем до 1 млн. метрик в секунду. Обрабатываем логов до 180 000 лог сообщений в секунду. Наша задача построить и развивать централизованную систему мониторинга, включающую в себя мониторинг инфраструктуры (ЦОД) и нескольких высоконагруженных информационных систем.

Ожидания от кандидата

Чем предстоит заниматься:

Построение, внедрение и развитие высоконагруженных многокомпонентных систем мониторинга:

Постановка на мониторинг инфраструктуры, приложений и бизнес показателей. Для всех стендов, включая разработку и тестирование;
Развитие централизованной системы мониторинга;
Создание и маршрутизация оповещений, включая предиктивную аналитику;
Консультации разработчиков по созданию метрик и сущностей мониторинга(сервис мониторы);
Интеграция систем мониторинга с другими системами компании;
Автоматизация процессов мониторинга;
Создание и построение комплексных экранов систем мониторинга;
Внедрение CI/CD для компонентов мониторинга;
Разработка системы логирования для приложений;
Обеспечение отказоустойчивости и быстродействия создаваемой системы;
Разработка приложений для нужд мониторинга в случаях, когда готового решения не существует.

От успешного кандидата мы ожидаем:

Опыт работы с Kubernetes (уверенный пользователь, опыт в развертывании и обслуживании будет большим плюсом);
Опыт администрирования ОС семейства Linux (Debian-based);
Знания устройства и принципов работы docker;
Опыт в работе с SQL; умение писать простые запросы; понимание, для чего нужны JOIN;
Опыт внедрения и построения многокомпонентных систем мониторинга(Prometheus-like стек, VictoriaMetrics, Graylog, Zabbix);
Опыт поддержки высоконагруженных систем мониторинга;
Опыт настройки и администрирования Grafana, ELK, Prometheus;
Знание скриптовых языков, Python, Bash, знание ЯП будет большим плюсом;
Умение читать и понимать чужой код (В основном Python, Go. Плюсом будет Java);
Опыт работы с системами виртуализации и Linux-контейнерами;
Опыт в работе с Helm (написание простых чартов, понимание принципов работы helm-template);
Уверенный пользователь систем версионирования кода (Предпочтительно Git);
Опыт работы с Gitlab CI;
Умение работать с системами управления автоматического развертывания конфигураций (Предпочтительно Ansible).

Условия работы

Что вам точно понравится:

Сложные и интересные задачи, работа с современным востребованным стеком;
Экспертная, увлеченная и талантливая команда, у которой можно многому научиться, культура открытости и взаимопомощи;
Конкурентная ЗП, оформление по ТК РФ;
ДМС со стоматологией после испытательного срока, ДМС для семьи с корпоративными скидками;
Страхование жизни и здоровья;
Предоставляем всю необходимую технику для работы;
Возможность работать удаленно/частично удаленно;
“Кафетерий” льгот (возмещение расходов на любое самообразование, спорт, ДМС для членов семьи, доступ к ИТ сервисам и т.д).