Ведущий специалист систем мониторинга (observability-инженер)
Требования
Местоположение и тип занятости
Компания
Описание вакансии
О компании и команде
Мы создаем единую распределенную систему масштаба страны, которая преобразит опыт совершения покупок, а именно позволит "оцифровать" каждую единицу товара уже к 2025 году.
Это позволит каждому покупателю быть уверенным в качестве и происхождении товара, а производителям и продавцам - не только уменьшить долю неоригинальной продукции на рынке, но и оптимизировать производственно-логистические процессы и сократить издержки за счет возможностей аналитической подсистемы. Уже сейчас система обрабатывает миллиарды транзакций ежедневно и оперирует петабайтами данных на скоростях десятки тысяч запросов в секунду.
О мониторинге:
Сама система мониторинга в настоящее время строится на стеке: Kubernetes, Prometheus + Victoria metrics; Clickhouse; ELK; Graylog; Grafana. Обрабатываем до 1 млн. метрик в секунду. Обрабатываем логов до 180 000 лог сообщений в секунду. Наша задача построить и развивать централизованную систему мониторинга, включающую в себя мониторинг инфраструктуры (ЦОД) и нескольких высоконагруженных информационных систем.
Ожидания от кандидата
Чем предстоит заниматься:
Построение, внедрение и развитие высоконагруженных многокомпонентных систем мониторинга:
- Постановка на мониторинг инфраструктуры, приложений и бизнес показателей. Для всех стендов, включая разработку и тестирование;
- Развитие централизованной системы мониторинга;
- Создание и маршрутизация оповещений, включая предиктивную аналитику;
- Консультации разработчиков по созданию метрик и сущностей мониторинга(сервис мониторы);
- Интеграция систем мониторинга с другими системами компании;
- Автоматизация процессов мониторинга;
- Создание и построение комплексных экранов систем мониторинга;
- Внедрение CI/CD для компонентов мониторинга;
- Разработка системы логирования для приложений;
- Обеспечение отказоустойчивости и быстродействия создаваемой системы;
- Разработка приложений для нужд мониторинга в случаях, когда готового решения не существует.
От успешного кандидата мы ожидаем:
- Опыт работы с Kubernetes (уверенный пользователь, опыт в развертывании и обслуживании будет большим плюсом);
- Опыт администрирования ОС семейства Linux (Debian-based);
- Знания устройства и принципов работы docker;
- Опыт в работе с SQL; умение писать простые запросы; понимание, для чего нужны JOIN;
- Опыт внедрения и построения многокомпонентных систем мониторинга(Prometheus-like стек, VictoriaMetrics, Graylog, Zabbix);
- Опыт поддержки высоконагруженных систем мониторинга;
- Опыт настройки и администрирования Grafana, ELK, Prometheus;
- Знание скриптовых языков, Python, Bash, знание ЯП будет большим плюсом;
- Умение читать и понимать чужой код (В основном Python, Go. Плюсом будет Java);
- Опыт работы с системами виртуализации и Linux-контейнерами;
- Опыт в работе с Helm (написание простых чартов, понимание принципов работы helm-template);
- Уверенный пользователь систем версионирования кода (Предпочтительно Git);
- Опыт работы с Gitlab CI;
- Умение работать с системами управления автоматического развертывания конфигураций (Предпочтительно Ansible).
Условия работы
Что вам точно понравится:
- Сложные и интересные задачи, работа с современным востребованным стеком;
- Экспертная, увлеченная и талантливая команда, у которой можно многому научиться, культура открытости и взаимопомощи;
- Конкурентная ЗП, оформление по ТК РФ;
- ДМС со стоматологией после испытательного срока, ДМС для семьи с корпоративными скидками;
- Страхование жизни и здоровья;
- Предоставляем всю необходимую технику для работы;
- Возможность работать удаленно/частично удаленно;
- “Кафетерий” льгот (возмещение расходов на любое самообразование, спорт, ДМС для членов семьи, доступ к ИТ сервисам и т.д).