Описание вакансии
Условия работы
Проект для одной из глобальных фирм по управлению инвестициями, основанной в 1989 году, которая управляет активами на сумму около 35,4 миллиарда долларов по состоянию на 1 апреля 2018 года. В фирме работает более 2400 сотрудников с офисами в Соединенных Штатах, Европе и Азии. Команды совместно работают над созданием торговых алгоритмов и финансовых стратегий - основы устойчивой глобальной торговой платформы.
Чтобы включить и контролировать торговые команды, мы ищем ведущих талантов для развития и расширения предложений.
Обязанности:
• Управляйте производственной средой, отслеживая доступность и принимая целостное представление о работоспособности системы.
• Решение проблем, связанных с инфраструктурой, с привлечением и инструктажем инженеров службы поддержки центров обработки данных, когда это необходимо (дисководы, оперативная память, процессор, сетевые карты, материнские платы)
• Мониторинг инфраструктуры (проблемы с сетью, дисковое пространство, загрузка и использование процессора и т.д.)
• Управление кластером Kubernetes
• Разработка, поддержка и тестирование кодовой базы salt, используемой для настройки и создания аппаратных узлов
• Автоматизация процедур управления инфраструктурой (вкл. написание сценариев на Python, bash)
• Настройка соответствующих конвейеров CI/CD в Gitlab и информационных панелей/менеджеров оповещений для конечных пользователей
• Создание программного обеспечения и систем для управления инфраструктурой платформы и приложениями
• Повышение надежности, качества и своевременности вывода на рынок нашего набора программных решений
• Измеряйте и оптимизируйте производительность системы, стремясь продвигать наши возможности вперед, опережать потребности клиентов и внедрять инновации для постоянного совершенствования.
• Обеспечение первичной операционной поддержки и инжиниринга для нескольких крупных распределенных программных приложений
• Сбор и анализ показателей как операционных систем, так и приложений, чтобы помочь в настройке производительности и поиске неисправностей.
• Сотрудничайте с командами разработчиков для улучшения услуг с помощью строгих процедур тестирования и выпуска.
• Участвовать в управлении платформой, планировании потенциала и оперативной поддержке.
• Создание устойчивых систем и услуг с помощью автоматизации и повышения производительности.
• Сбалансируйте скорость и надежность разработки функций с четко определенными целями уровня обслуживания.
Описание Обязательных Навыков:
• более 5 лет опыта работы в качестве инженера SRE/DevOps, ответственного за развертывание и обслуживание производственных систем
• Опыт системного администрирования Linux, опыт работы с внутренними устройствами операционных систем и сетями
• Хорошие навыки написания сценариев (Bash, Python)
• Опыт работы с системой контроля версий Git
• Стремление к реинжинирингу и автоматизации процессов
• Способность находить и использовать соответствующие инструменты с открытым исходным кодом для достижения поставленных целей
Плюсом будет:
∙ Управление инфраструктурой AWS
∙ Опыт терраформирования
∙ Настройка кластера Kubernetes - HA, политики безопасности pod и контроллеры доступа
∙ Опыт работы с системами и ИТ-поддержкой при настройке трубопроводов CI/CD