Старший системный администратор Cloud duty (General Incident Commander)
Требования
Местоположение и тип занятости
Компания
Описание вакансии
О компании и команде
Облако Selectel представляет собой широкий набор микросервисов и подсистем, слаженная работа которых позволяет эффективно управлять виртуальными машинами, кластерами Kubernetes, базами данных и другими объектами.
Дежурная служба отвечает за бесперебойную доступность Облака, обрабатывая сообщения системы мониторинга и помогая коллегам с технически сложными задачами.
Ищем технического лидера в Дежурную службу. В его задачи будет входить организация процессов решения критичных инцидентов, анализ происшествий, сбор дополнительных технических данных, а также организация работы между смежными отделами для того, чтобы предотвратить повторное происшествие в будущем, выстраивание сотруднических отношений и процессов взаимодействия команд и стейкхолдеров, постановка и контроль выполнения рабочих задач, а также повышение технической экспертизы текущих сотрудников дежурной службы.
Ожидания от кандидата
Желательные требования к кандидату
- Опыт работы с проектом OpenStack, его экосистемой и инфраструктурой для работы с ним.
- Опыт работы с виртуализацией на базе libvirt/QEMU/KVM
- Опыт работы с MySQL Galera Cluster, Redis, RabbitMQ, Memcached
- Опыт разработки скриптов автоматизации на bash/Python/Go
- Хорошее владение любой системой сбора и визуализации метрик
- Знание методологий, таких как ITIL, для эффективного управления задачами
- Опыт управления командой, включая мотивацию, делегирование и разрешение конфликтов.
- Владение английским на уровне, достаточном для чтения документации.
Обязанности
- Изучать и анализировать инциденты, чтобы понять их причины и предложить улучшения.
- Взаимодействовать с командами разработки и технической поддержки для решения инцидентов.
- Организовывать и проводить анализ после завершения инцидентов.
- Предоставлять разработчикам информацию о проблемах и предложениях по улучшению продуктов.
- Участвовать в планировании и принятии решений по развитию облачной платформы.
- Подготавливать отчеты о происшествиях, предоставлять информацию о решениях.
- Обеспечивать эффективную связь с клиентами и внутренними командами.
- Помогать коллегам из смежных отделов.
- Диагностировать и устранять проблемы в работе инфраструктуры и сетевой связности.
- Разрабатывать и администрировать средства автоматизации для ускорения реакции на инциденты и их решения.
- Повышать техническую экспертизу сотрудников дежурной службы.
- Улучшать процессы мониторинга и реагирования на события, которые могут повлиять на доступность облака.
- Создавать и обновлять регламенты и инструкции для работы, актуализировать документацию.
- Хорошие навыки работы с Linux системами на уровне администратора
- Понимание базовых принципов работы сетей: стандартные протоколы и их применение, алгоритмы балансировки, технологии обеспечения High Availability.
- Опыт работы с High Availability системами или инфраструктурой публичного продукта в сфере телекоммуникаций или хостинга
- Умение анализировать технические данные и выявлять корневые причины проблем
- Отличные навыки коммуникации для взаимодействия со смежными отделами и стейкхолдерами, умение аргументировано доносить свою позицию
- Умение строить сотруднические отношения и эффективно взаимодействовать с разными людьми.
- Умение планировать и контролировать рабочие задачи.
- Способность управлять временем и приоритетами.
- Опыт работы в распределенной команде или в удалённом режиме.
- Эмпатия и способность вдохновлять команду.
Условия работы
- Оформление в официально аккредитованную IT-компанию
- Белая заработная плата
- Годовая премия по результатам работы до 15% от суммарного оклада за 12 месяцев
- 30 000 бонусных рублей на услуги компании ежегодно
- Релокационный бонус при переезде
- Бесплатные обеды и кофе-брейки
- Офис в Санкт-Петербурге, 10 минут пешком от м. Московские ворота, своя парковка (и для велосипедов тоже)
Бонусы
- Ежемесячная надбавка за некурение
- ДМС + стоматология + офисный врач*
- Доступ к психологическим консультациям: онлайн, в офисе или кабинете психолога
- 50% оплата абонемента в фитнес-клуб
- Спортивные мероприятия (турниры по пейнтболу, картингу, «Гонка героев», киберспорт)
- Аренда залов для футбола на газоне, пляжного волейбола, йога в офисе
- Офисный душ
- От 50% до 100% оплаты обучения английскому, 50% — испанскому, еженедельные бесплатные разговорные клубы с носителями английского языка
- Внутренние обмены знаниями: lightning & thunder talks
- Персонализированный план обучения, возможность участия в конференциях по всему миру
- Онлайн-библиотека Alpina Digital
- Образовательные мероприятия (мастер-классы, лекции про вселенную или по психологии, квизы и многое другое)
- PlayStation VR zone, кикер и настольный тенниc