Site Reliability Engineer (Kubernetes) в VK

Местоположение и тип занятости

Москва, Санкт-ПетербургПолный рабочий деньМожно удаленно

Компания

Место встречи лучших

Описание вакансии

О компании и команде

Мы строим единую облачную технологическую платформу для всех сервисов VK. Сейчас платформу используют такие проекты как ok.ru, dzen.ru, vk.com и другие сервисы. А еще к нам в платформу активно мигрируют остальные крупные сервисы компании, например, Mail.ru, Маруся, Movika.

У нас самый настоящий хайлоад, сотни тысяч rps, геораспределенные датацентры и десятки миллионов реальных пользователей каждый день.

Мы ищем изначально мотивированных и творческих профессионалов, готовых взять на себя ответственность за проектирование и разработку высокомасштабируемых и надежных сервисов на базе Kubernetes. С нами ты сможешь проектировать одну из крупнейших ИТ инфраструктур в СНГ и видеть, как твои решения влияют на конечных пользователей.

Что мы уже имеем:

  • k8s продуктовые кластера от 50 до 1к нод;
  • Много логов и метрик - от 100 ТБ в сутки;
  • ipv6 в k8s (настоящий, в проде);
  • Свой S3 на основе Ceph, 4 pt.

Наш стек:

Kubernetes

  • очень любим и активно используем cilium, но кое-где осталась calico;
  • VictoriaMetrics и все вокруг;
  • Golang - решаем нестандартные задачи;
  • Istio - делаем сервис меш между кластерами;

При этом мы постоянно ищем новые решения и инструменты.

Инфраструктура:

  • kafka, clickhouse, m3db - любим смотреть на логи и метрики;
  • puppet’ом накатываем базовый слой инфраструктуры;
  • gitlab-ci;
  • pgSQL, patroni - и про БД не забываем.

Чем предстоит заниматься:

  • RnD новых решений и технологий - мы стараемся делать наши кластера быстрее и надежнее;
  • выработка практик эксплуатации кластеров - рассказываем командам эксплуатации, как им применять наши технологические решения;
  • написание документации - важный элемент для предтвращения хаоса в работе с кластерами.

Ожидания от кандидата

  • опыт администрирования Linux-серверов и TCP/IP-сетей;
  • опыт развертывания и администрирования распределенных систем, понимание принципов организации балансировки нагрузки, отказоустойчивости, надежности, высокой доступности;
  • опыт администрирования и развертывания приложений в K8S;
  • опыт работы с SCM;
  • знание скриптовых языков(python, bash).

Условия работы

  • сложные и интересные задачи: высоконагруженные быстрорастущие сервисы, которые задают уровень для конкурентов качеством и технологиями;
  • оборудование: мощное железо, десятки петабайт данных, GPU-кластера и облачный инструментарий;
  • команда: с нами работают професcионалы экстра класса, каждый из которых может поделиться своей экспертизой;
  • профессиональное развитие: прямо в офисе мы организуем митапы, конференции, семинары и тренинги, куда открыт доступ каждому сотруднику, а также регулярно посещаем лучшие мировые конференции;
  • новый опыт: лучшие сотрудники преподают в наших образовательных проектах, выступают на российских и международных конференциях;
  • офис в 5 минутах от метро, крытый паркинг для сотрудников, велопарковка;
  • возможность работать в гибридном формате (как удаленно, так и из офиса);
  • спорт: компания компенсирует затраты на спортивные активности — занятия в фитнес-клубе, индивидуальные тренировки, участия в соревнованиях;
  • компенсация питания;
  • регулярно пересматриваемая зарплата, годовые бонусы, социальный пакет с первого дня (ДМС для сотрудника и его детей, английский язык).