Data Platform Reliability Engineer
Требования
Местоположение и тип занятости
Компания
Сервис объявлений, которым каждый месяц пользуется треть населения России
Описание вакансии
Условия работы
Работа в Data Platform Авито это взаимодействие только с разработчиками — только хардкор: 300 серверов и сложная сетевая инфраструктура — нагрузки огромные, задачи интересные, сutting-edge подходы и технологии, работа с крутыми профессионалами.
Масштаб:
- несколько ДЦ - сейчас 3, один основной;
- ~ 300 серверов под базы данных и очереди;
- ~ 60000 RPS для in-Memory решений в пиках до 360 000 RPS;
- ~ 20000 RPS к MongoDB с пиками до 70000 RPS;
- 300 000 RPS в 1 из кластеров Kafka.
Мы ждём тебя, если ты:
- имеешь опыт администратора Linux, разбираешься в консольных утилитах, системах инициализации Linux - мы используем Debian;
- хотя бы немного программируешь, не нужно выдавать сотни строк кода в день, но хороший системный администратор — ленивый системный администратор, и автоматизировать рутинные задачи можно и нужно (для внутренних утилит мы предпочитаем Python);
- понимаешь принципы работы СУБД и транзакционной машины;
- настраивал, администрировал или создавал системы резервного копирования баз данных (как минимум одну из Redis/MongoDB/Tarantool/ClickHouse + желание развить экспертизу по другим).
Плюсом будет опыт работы с:
- высоконагруженными системами (> 20 000 RPS);
- системами высокой доступности (High Availability);
- Kafka;
- Grafana;
- опыт работы с puppet;
- Python, Go;
- опыт работы с Docker, LXC, Kubernetes.
Мы ищем человека, который вместе с нами будет заниматься:
- поддержкой и развитием Data Platform Авито (~ 300 серверов под базы данных и очереди);
- Redis/MongoDB/Tarantool/ClickHouse/Kafka/RabbitMQ/Elasticsearch;
- сетап серверов;
- настройкой производительности;
- работой с контейнерами;
- настройкой и доработкой мониторинга (стек Graphite);
- решением проблем производительности/поиск узких мест + RND продуктовых сервисов и DBA инфраструктуры;
- перестройкой, актуализацией политик доступа, созданием новых инструментов для управления ими;
- написанием инфраструктурного кода (внедрение Infrastructure As Code (IAC), Puppet);
- разработкой/поддержкой инфраструктурных микросервисов;
- вводом в строй нового оборудования;
- Database discovery (Consul) + HaProxy/twemproxy/PgBouncer;
- построением DBaaS (база данных как услуга);
- поддержкой решений задач потоковой аналитики;
- развитием процессов разработки делая их удобнее и быстрее.
Чем (почти) не придётся заниматься:
- администрированием сети;
- работой с железом;
- аудитом безопасности.
Основные используемые технологии:
- Puppet
- Ceph
- сеть на Juniper
- OpenVPN
- Graphite, Grafana, Moira
- OS Debian
- сервера Dell, HP
- Haproxy
- NGINX
- LXC
- Docker
- Kubernetes
Бонусы
- прозрачная система бонусов и премий, достойная зарплата — размер обсудим на собеседовании;
- красивый и комфортный офис в 2 минутах от метро «Белорусская»: панорамный вид на центр города, места для уединённой работы, зоны отдыха, гамаки и скейтборды;
- возможность реализовать свои идеи в проекте с многомиллионной аудиторией;
- команда профессионалов, готовых поддержать ваши инициативы;
- открытость для профессионального сообщества: мы делимся разработками на GitHub, рассказываем об опыте решения задач в блоге на Habr;
- обучение за счёт компании: мы оплачиваем участие в российских и международных конференциях, профильные курсы и доступ к онлайн-библиотеке МИФ, покупаем нужную сотрудникам литературу;
- помощь с переездом: если вы живёте в другом городе, мы оплатим приезд на интервью и поможем обустроиться в Москве;
- бесплатные обеды, фрукты и вечерние сэндвичи каждый день, а по пятницам ещё и завтраки;
- забота о здоровье: с первого дня работы вы получите страховку со стоматологией, в офисе ведут приём терапевт, психолог и массажист.