SRE (Site Reliability Engineer)

1 апреля

Зарплата

от 150 000 до 200 000 ₽

Требования

Инженер по доступности сервисов • SQL • REST • RabbitMQ

Местоположение и тип занятости

Москва • Полный рабочий день

Компания

Hello, Doc!

Телемедицинская платформа

Описание вакансии

О компании и команде

В компанию Hello, Doc!, которая ежедневно помогает тысячам людей решать их проблемы со здоровьем и позволяет врачам вести частную практику, требуется SRE (Site Reliability Engineer).

Ожидания от кандидата

Основные задачи:

Обеспечение отказоустойчивости – минимизация простоев рабочих интеграций (SLA/SLO/SLI).
Координация между поддержкой, разработкой и партнерами (роль «мостика»).
Автоматизация рутинных задач (чтобы меньше времени тратить на ручную работу).
Мониторинг и алертинг – быстрое выявление и устранение проблем.
Инженерная работа с инцидентами (postmortem, устранение root cause).
Сопровождение базового ПО и ПК сотрудников (активировать, установить, настроить).

Технические навыки:

Глубокое понимание API и сетевых взаимодействий (REST, WebSockets).
Анализ логов и трассировок.
Работа с форматами данных (JSON, XML) и их валидация.
Знание middleware и message brokers (Kafka, RabbitMQ).
Базовое администрирование БД (SQL/NoSQL) для анализа проблем и подготовки отчетов.

Владение инструментами:

Мониторинг: Prometheus, Grafana, Sentry.
Логи: ELK Stack (Elasticsearch, Logstash, Kibana), Loki.

Будет плюсом знакомство с:

Автоматизация: Kubernetes, Terraform.
CI/CD: GitLab CI, ArgoCD.
Dev: Python, Django, Docker.

Навыки коммуникации и работы с партнерами:

Умение четко формулировать проблемы техническим и нетехническим языком.
Ведение переговоров в чатах/тикетах (например, Telegram, Pachka).
Способность воспроизводить проблемы на стороне партнера (например, через Postman, curl).
Ведение базы знаний (Wiki) с частыми сценариями ошибок.
Создание чек-листов для поддержки, чтобы быстрее диагностировать проблемы.
Подключение к взаимодействию/переписке с партнёрами относительно устранения проблем в интеграциях.
Аналитика возникающих проблем в системах мониторинга, их сортировка по степени критичности и локализация отдела, который должен получить информацию о проблемах для сведения/для исправления.

Условия работы

Мы предлагаем:

График работы: 5 дней в неделю, с понедельника по пятницу, с 10:00 до 19:00. Возможность удаленной и офисной работы — гибридный формат.
Уровень дохода: от 150 000 до 200 000 рублей.