Ведущий архитектор [NVidia SuperPOD]
Требования
Местоположение и тип занятости
Компания
Крупнейшая телекоммуникационная и ведущая ИТ-компания
Описание вакансии
Условия работы
#CloudMTS — это публичное облако для бизнеса. Мы предоставляем тысячам компаний современные и надёжные сервисы. Наша инфраструктура использует 6 датацентров по всей России.
Задачи:
- администрирование и оптимизация работы СХД и файловых систем;
- администрирование, обеспечение непрерывной и отказоустойчивой работы серверов и оптимизация их работы под управлением ОС Linux;
- управление и настройка активного сетевого оборудования: маршрутизаторы, коммутаторы;
- администрирование сетевых сервисов вычислительного комплекса;
- администрирование различных СУБД;
- диагностика и решение пограничных проблем, связанных со снижением производительности ОС, СХД, СУБД;
- развертывание и оптимизация производительности системного и прикладного ПО;
- взаимодействие с вендорами оборудования и разработчиками информационных систем и сервисов;
- поддержка пользователей компании и ее заказчиков в части применения вычислительных ресурсов для решения прикладных задач;
- проактивная работа по предотвращению аварийных остановок серверов, обеспечение оперативной реакции на аварии и сбои;
- внедрение и поддержка нового кластерного и прикладного ПО;
- автоматизация процессов развертывания ПО и управления конфигурациями;
- постановка задач Linux инженерам обслуживающим комплекс и контроль их исполнения;
- разработка документации в части эксплуатации вычислительного оборудования, инструкций пользователей и администраторов;
- разработка архитектурных решений для новых сегментов вычислительного оборудования, проработка решений для внедрения в имеющуюся архитектуру.
Опыт и компетенции:
Уверенные знания в следующих областях:
- операционные системы: GNU/Linux (CentOS, Debian) – установка, настройка, оптимизация под задачи, поиск узких мест;
- система провизионинга и управления конфигурациями: Ansible;
- системы мониторинга: Zabbix, Grafana, Prometheus – установка, настройка, оптимизация, разработка плагинов и модулей;
- система управления заданиями Slurm – установка, настройка, оптимизация, разработка плагинов и модулей;
- Gluster. UrBackup – установка, оптимизация, настройка отказоустойчивых решений;
- СУБД: MySQL, MariaDB, PostreSQL – установка, оптимизация, настройка репликаций, резервное копирование;
- платформы контейнеризации: Docker, Singularity, Kubernetes – установка, настройка, оптимизация;
- прикладное ПО вычислительных кластеров: mpi (openmpi, mvapich, intel mpi), cuda – установка, настройка, оптимизация;
- прочие сервисы: DNS, DHCP, LDAP (OpenLDAP), FTP, IPMI, SNMP – настройка, оптимизация.
Желателен опыт работы с оборудованием:
- сетевое оборудование: Mellanox(Cumulus Linux), Mellanox InfiniBand, Cisco;
- серверы: NVidia DGXA100, Dell, HPE, Huawei;
- системы хранения данных: NetApp,Huawei.
Условия:
- Офис в БЦ Декарт (м. Технопарк);
- Белая заработная плата + премия;
- Работа в прогрессивной ИТ-компании, лидере в своей сфере, в команде высокопрофессиональных ИТ-специалистов;
- Обширные возможности профессионального роста;
- ДМС со стоматологией, страхование жизни, страхование при поездках за рубеж;
- Оплата мобильной связи;
- Хороший отдых — отпуск 28 календарных дней + 3 календарных дня дополнительно ежегодно;
- Возможность обучения;
- Корпоративные мероприятия;
- Работа в дружном коллективе.