Site Reliability Engineer (Kubernetes) в VK
Требования
Местоположение и тип занятости
Компания
Описание вакансии
О компании и команде
Мы строим единую облачную технологическую платформу для всех сервисов VK. Сейчас платформу используют такие проекты как ok.ru, dzen.ru, vk.com и другие сервисы. А еще к нам в платформу активно мигрируют остальные крупные сервисы компании, например, Mail.ru, Маруся, Movika.
У нас самый настоящий хайлоад, сотни тысяч rps, геораспределенные датацентры и десятки миллионов реальных пользователей каждый день.
Мы ищем изначально мотивированных и творческих профессионалов, готовых взять на себя ответственность за проектирование и разработку высокомасштабируемых и надежных сервисов на базе Kubernetes. С нами ты сможешь проектировать одну из крупнейших ИТ инфраструктур в СНГ и видеть, как твои решения влияют на конечных пользователей.
Что мы уже имеем:
- k8s продуктовые кластера от 50 до 1к нод;
- Много логов и метрик - от 100 ТБ в сутки;
- ipv6 в k8s (настоящий, в проде);
- Свой S3 на основе Ceph, 4 pt.
Наш стек:
Kubernetes:
- очень любим и активно используем cilium, но кое-где осталась calico;
- VictoriaMetrics и все вокруг;
- Golang - решаем нестандартные задачи;
- Istio - делаем сервис меш между кластерами;
При этом мы постоянно ищем новые решения и инструменты.
Инфраструктура:
- kafka, clickhouse, m3db - любим смотреть на логи и метрики;
- puppet’ом накатываем базовый слой инфраструктуры;
- gitlab-ci;
- pgSQL, patroni - и про БД не забываем.
Чем предстоит заниматься:
- RnD новых решений и технологий - мы стараемся делать наши кластера быстрее и надежнее;
- выработка практик эксплуатации кластеров - рассказываем командам эксплуатации, как им применять наши технологические решения;
- написание документации - важный элемент для предтвращения хаоса в работе с кластерами.
Ожидания от кандидата
- опыт администрирования Linux-серверов и TCP/IP-сетей;
- опыт развертывания и администрирования распределенных систем, понимание принципов организации балансировки нагрузки, отказоустойчивости, надежности, высокой доступности;
- опыт администрирования и развертывания приложений в K8S;
- опыт работы с SCM;
- знание скриптовых языков(python, bash).
Условия работы
- сложные и интересные задачи: высоконагруженные быстрорастущие сервисы, которые задают уровень для конкурентов качеством и технологиями;
- оборудование: мощное железо, десятки петабайт данных, GPU-кластера и облачный инструментарий;
- команда: с нами работают професcионалы экстра класса, каждый из которых может поделиться своей экспертизой;
- профессиональное развитие: прямо в офисе мы организуем митапы, конференции, семинары и тренинги, куда открыт доступ каждому сотруднику, а также регулярно посещаем лучшие мировые конференции;
- новый опыт: лучшие сотрудники преподают в наших образовательных проектах, выступают на российских и международных конференциях;
- офис в 5 минутах от метро, крытый паркинг для сотрудников, велопарковка;
- возможность работать в гибридном формате (как удаленно, так и из офиса);
- спорт: компания компенсирует затраты на спортивные активности — занятия в фитнес-клубе, индивидуальные тренировки, участия в соревнованиях;
- компенсация питания;
- регулярно пересматриваемая зарплата, годовые бонусы, социальный пакет с первого дня (ДМС для сотрудника и его детей, английский язык).