💥 Ищем дата-инженера для участия в Публичном собеседовании на Хабр Карьере. Оставить заявку можно здесь → Участвую!

SRE (Site Reliability Engineer)

Зарплата

от 150 000 до 200 000 ₽

Местоположение и тип занятости

МоскваПолный рабочий день

Компания

Телемедицинская платформа

Описание вакансии

О компании и команде

В компанию Hello, Doc!, которая ежедневно помогает тысячам людей решать их проблемы со здоровьем и позволяет врачам вести частную практику, требуется SRE (Site Reliability Engineer).

Ожидания от кандидата

Основные задачи:

  • Обеспечение отказоустойчивости – минимизация простоев рабочих интеграций (SLA/SLO/SLI).
  • Координация между поддержкой, разработкой и партнерами (роль «мостика»).
  • Автоматизация рутинных задач (чтобы меньше времени тратить на ручную работу).
  • Мониторинг и алертинг – быстрое выявление и устранение проблем.
  • Инженерная работа с инцидентами (postmortem, устранение root cause).
  • Сопровождение базового ПО и ПК сотрудников (активировать, установить, настроить).

Технические навыки:

  • Глубокое понимание API и сетевых взаимодействий (REST, WebSockets).
  • Анализ логов и трассировок.
  • Работа с форматами данных (JSON, XML) и их валидация.
  • Знание middleware и message brokers (Kafka, RabbitMQ).
  • Базовое администрирование БД (SQL/NoSQL) для анализа проблем и подготовки отчетов.

Владение инструментами:

  • Мониторинг: Prometheus, Grafana, Sentry.
  • Логи: ELK Stack (Elasticsearch, Logstash, Kibana), Loki.

Будет плюсом знакомство с:

  • Автоматизация: Kubernetes, Terraform.
  • CI/CD: GitLab CI, ArgoCD.
  • Dev: Python, Django, Docker.

Навыки коммуникации и работы с партнерами:

  • Умение четко формулировать проблемы техническим и нетехническим языком.
  • Ведение переговоров в чатах/тикетах (например, Telegram, Pachka).
  • Способность воспроизводить проблемы на стороне партнера (например, через Postman, curl).
  • Ведение базы знаний (Wiki) с частыми сценариями ошибок.
  • Создание чек-листов для поддержки, чтобы быстрее диагностировать проблемы.
  • Подключение к взаимодействию/переписке с партнёрами относительно устранения проблем в интеграциях.
  • Аналитика возникающих проблем в системах мониторинга, их сортировка по степени критичности и локализация отдела, который должен получить информацию о проблемах для сведения/для исправления.

Условия работы

Мы предлагаем:

  • График работы: 5 дней в неделю, с понедельника по пятницу, с 10:00 до 19:00. Возможность удаленной и офисной работы — гибридный формат.
  • Уровень дохода: от 150 000 до 200 000 рублей.