Senior SRE Engineer

Местоположение и тип занятости

Полный рабочий деньМожно удаленно

Компания

Делаем образование современным и доступным с помощью технологий

Описание вакансии

О компании и команде

Skyeng — это не только онлайн-школа, но и сильная IT-компания с масштабным операционным блоком. Мы драйвим технологии и меняем облик онлайн-образования: не ищем готовый софт, а делаем свой, но идеальный. Постоянно растем и создаем комфортную корпоративную среду — автоматизируем рутинные процессы и помогаем друг другу с интересными челленджами.
В IT-команде больше 500 сотрудников, наша разработка — это 44 независимых и быстрых продуктовых команд с опытными тимлидами и продактами.

За что отвечает команда Ops в Skyeng:

Стабильная работа production окружения. У нас гибридная инфраструктура из облачных решений и on-premises в нескольких ЦОДах — для реализации изменений требуются качественные технические решения, для которых необходимо обеспечивать развитие следующих направлений:

  1. Proxmox (несколько кластеров, все управляется через Ansible)
  2. IaC (на базе Ansible + AWX и Terraform)
  3. Мониторинг (реализован на базе VictoriaMetrics + Alertmanager, Graphite (отказываемся), Elastic APM)
  4. Базы данных (много PostgreSQL, меньше MySQL и ClickHouse, как в виде RDS, так и на Bare Metal)
  5. Шина данных (кластеры RabbitMQ и Kafka, органический рост и бесперебойная работа в любых условиях)
  6. Сеть в ЦОД, VPN (мы умеем измерять качественную работу сети, требуется поддерживать ее работу в рамках SLA)
  7. Группа серверов балансировки трафика (используем Nginx, есть несколько подгрупп для разного типа трафика)
  8. Резервное копирование данных (активно используем обычные сервера и S3 для хранения резервных данных).
  9. Катастрофоустойчивость инфраструктуры, возможность переключить нагрузку всех сервисов в резервный ЦОД
  10. Cтабильная работа ключевых сервисов. В экосистеме сервисов есть ряд крупных подсистем (сервис авторизации, сервис проведения уроков), от работы которых зависит возможность оказания услуг. Для стабильной работы требуется обеспечить развитие инфраструктуры без простоя в работе

Наши продукты: онлайн-платформа Vimbox, Android и IOS-приложения, словари, браузерные расширения, внутренние CRM и финансовые системы. В 2020 году Skyeng вошел в топ 10 IT-компаний России.
Наша инфраструктура: более 300 продуктивных серверов на bare metal и в облаках. 400 сервисов в Kubernetes, остальные — в облаке или на on-premises. Backend всех сервисов написан на PHP, 85% на фреймворке Symfony.
Наши инструменты для документации и общения: TiMe, Hangouts, Jira, Confluence, Github.

Ожидания от кандидата

Чем предстоит заниматься:

  • Развивать и поддерживать инфраструктуру компании
  • Обеспечивать работу сервисов компании на нескольких площадках
  • Администрировать сервера и базы данных
  • Развивать и поддерживать инфраструктуры мониторинга
  • Анализировать проблемы в работе продуктивных сервисов, реализовывать проекты, предотвращать повторное возникновение проблем
  • Автоматизировать часто возникающие задачи

Условия работы

Наш идеальный кандидат:

  • Имеет опыт настройки и сопровождения Linux-based систем на базе Debian/Ubuntu
  • Имеет опыт настройки Nginx, PHP-FPM под высокие нагрузки
  • Имеет опыт работы с системами управления конфигурациями Ansible или аналогами
  • Имеет опыт программирования на Python, Bash
  • Имеет опыт поддержки и развития систем мониторинга (Prometheus/VictoriaMetrics/Grafana)
  • Имеет опыт администрирования СУБД PostgreSQL, MySQL оптимизации конфигурации под высокие нагрузки

    Будет плюсом:
  • Опыт администрирования СУБД Clickhouse, Kafka
  • Наличие опыта реализации сложных технической проектов
  • Понимание, как бесперебойно эксплуатировать продуктивные системы под постоянной нагрузкой

Бонусы

Причины работать с нами:

  • Работа над социально значимым продуктом — мы меняем образование и делаем его таким, чтоб прямо вау
  • Мы аккредитованная IT компания
  • Самореализация: быстрый профессиональный и карьерный рост на интересных задачах, внедрение новых идей
  • Постоянно развиваемся: регулярные доклады разработчиков внутри компании, участие и выступления на конференциях
  • Скидки до 50% на продукты компании для тебя, твоего друга или ребенка
  • Обучение за наш счет: персональный план развития, менторинг, коучинг, тренинги по публичным выступлениям и доступ к более чем 100 курсам в корпоративном университете и электронной библиотеке
  • Стабильная заработная плата два раза в месяц, оплачиваемые отпуск и больничный;
  • Можно работать удаленно из любой точки мира, а также из нашего уютного офиса в Москве (м. Таганская)