👋 Стартовала третья неделя марафона, посвящённая мотивации и отношениям в команде! Со Skyeng и IVI обсудим, как дружить с коллегами на удалёнке и находить в себе силы на работу и общение. Регистрируйтесь на страничке марафона и присоединяйтесь!
bhavengerbhavenger

Дмитрий Зайцев

System engineer, SRE, Engineering manager · Администрирование · Менеджмент · Ведущий (Lead)
От 6000 $ · Не ищу работу
Возраст: 33 года
Опыт работы: 13 лет и 1 месяц
Регистрация: 10.01.2009
Последний визит: 3 месяца назад
Местоположение: Россия, Москва
Войдите, чтобы посмотреть контакты пользователя

Обо мне

Дорого помогаю решать проблемы, связанные с людьми, технологиями и процессами.

Опыт работы в различных индустриях - gaming, ad-tech, big-data+ml, blockchain + charity.

Опыт построения сильных команд и управления этими командами.

Опыт выживания и пробивания стен инертности и неэффективности в энтерпрайзе. Также опыт поддержки быстрого развития в стартапе.

Участие в профессиональных сообществах

Опыт работы

  • Маркетинговая платформа, которая позволяет привлекать новых клиентов
    Москва · От 10 до 100 сотрудников
    Head of SRE
    Июль 2019 — По настоящее время (1 год и 5 месяцев)
  • Ru-сообщество
    Москва
    Январь 2016 — По настоящее время (4 года и 11 месяцев)
  • banfico.com
    Лондон
    Senior SRE
    Ноябрь 2018 — Июнь 2019 (8 месяцев)

    Technology stack - aws, k8s, terraform, ansible, gitlab, java, nodejs.

  • humaniq
    Лондон
    SRE
    Апрель 2018 — Январь 2019 (10 месяцев)

    https://humaniq.com/about - платформа для charity проектов. Собственный блокчейн токен.

    Помогал делать приложение, признанное TechCrunch как Top Pick in Blockchain на Disrupt SF 2018

  • oneFactor
    Москва
    Руководитель по сопровождению сервисов и платформ
    Март 2016 — Апрель 2018 (2 года и 2 месяца)

    https://1f.ai - сервисы искусственного интеллекта для скоринга и цифровой наружной рекламы, работающие на больших данных от МегаФона и других провайдеров данных.

    Обязанности:

    • Ответственность за обработку петабайт данных и работу сервисов с заданными SLA. 2 площадки обработки данных - одна в МегаФоне, вторую построили сами.
    • Управление 3 группами - системные инженеры (9 человек), тех. саппорт (2 человека), внутренний IT (1 человек).

    За два года сделано:

    • Запустил новую площадку для платформы обработки данных - выбор провайдера, договорные отношения, проработка ценовой политики, проектирование 10-гигабитной сети, как сервиса от провайдера. Также проработка серверной начинки под требования процессов обработки данных.
    • Управление группой системных инженеров - дополнительный найм людей и наладка работы группы. Проработка границ ответственности, процессов, стандартов. Техническое лидерство в группе, развитие людей, ревью решений, помощь в работе, регулярные встречи 1 на 1.
    • Архитектура и процессы для новой платформы для запуска сервисов в рамках 3-месячной работы лучших людей компании по разработке proof-of-concept нового подхода к запуску сервисов и обработке данных.
    • Наладил работающий процесс управления инцидентами - мониторинг, основанный на данных; дежурства; алертинг; чеклисты и инструкции; зоны ответственности.
    • Управление инфраструктурой и платформой - naming conventions, стандарты, style guide, линтеры, процесс разработки. Евангелизация лучших практик и стандартов работы внутри компании.
    • Создал и запустил работу группы технического саппорта с нуля.
    • Моделирование угроз и непрерывная работа над безопасностью платформ и данных - как процессная и описательная часть - так и тулинг вокруг - kerberos, сквозная имперсонализация в сервисах, пентестинг.
    • Проработал и реализовал процесс управления секретами, использующий Hashicorp Vault.
    • Создал стандарты работы и именования для документации. Вообще много усилий вложил в документацию, шаблоны, стандарты, снизив сложность работы с огромной и разнообразной платформой обработки данных и разными сервисами.
    • Разработал утилиту для быстрого развертывания hadoop-кластеров для тестирования.
    • Разработал утилиту для управления виртуальными машинами через API openstack (кастомный openstack, утилиты от сообщества не применимы).

    Отзывы от бывших коллег про работу группы системных инженеров:
    * Короч работаю я сейчас, работаю. И всё чаще вспоминаю наших девопсов из 1F. Такие золотца все. Так нормально делали... Всё в сравнении познаётся конечн) выражаю своё увОжение короч
    * В 1f был девопс-Олимп. Мои нынешние девопсы из Пуны любую задачу делают месяц.

    Стек технологий (да, он огромен) - java \ scala, python \ go, flink \ spark ss \ storm, kafka \ rabbitmq, yarn, hdfs (parquet \ auro \ gz), mr1 \ spark, hue \ hive \ impala \ jupiterhub\ rstudio \ zeppelin \ etc, oozie \ luigi, hbase \ cassandra \ mongodb \ clickhouse \ kudu, postgres, consul, elk, graphite \ ganglia, vault \ kerberos, nagios \ sensu, docker, puppet \ ansible, jenkins, множество внутренних утилит и сервисов.

  • World leader in the development of online advertising technical solutions
    Москва · От 100 до 1000 сотрудников
    Senior infrustructure developement engineer
    Август 2015 — Март 2016 (8 месяцев)

    Компания занимается разработкой технологической платформы для интернет-рекламы. На платформе работало от 5 до 10% интернет рекламы в мире.

    Помогал команде разработки большого внутреннего продукта на C++ улучшить процесс тестирования новых релизов.

    • Разработал CI-фреймворк для внутреннего продукта компании (u-server).
    • Разработал фреймворк для тестирования внутреннего продукта (u-server).
    • Удвоил скорость выполнения полного набора тестов.
    • Разработал систему нагрузочного тестирования разных версий u-server с последующим сравнением метрик.

    Стек технологий - python, redis, docker, jenkins, aptly, py.test \ nose, avro, множество внутренних утилит и сервисов.

  • Сервис онлайн-консультаций
    Москва
    site reliability engineer по редкому вызову
    Август 2014 — Май 2015 (10 месяцев)

    Участвовал в проектировании, создал и поддерживаю боевую и тестовую инфраструктуры проекта.

    Стек технологий - RoR, nodeJS, Postgres, MongoDB, Redis, Teamcity.

  • Виртуальный стол для настольных игр
    Москва
    site reliability engineer по редкому вызову
    Февраль 2014 — Февраль 2016 (2 года и 1 месяц)

    Проектирование, создание и поддержка боевой и тестовой инфраструктуры проекта.

    Стек технологий - .net, iis, unity, postgres, redis, rabbitmq, ansible, logstash, elasticsearch, graphite, sensu, flapjack, teamcity.

  • Разработка мультиплатформенных многопользовательских браузерных мобильных игр
    Новосибирск · От 10 до 100 сотрудников
    Senior Linux Administrator, IT Lead
    Август 2013 — Июль 2015 (2 года)

    http://playtox.ru - компания занимается разработкой игр для мобильных платформ.

    Отвечал за работу сервисов компании и ИТ-группу.

    • Уменьшил количество инцидентов в продуктивной среде, работающей в режиме 24\7 (большая ферма серверов на разных площадках в разных странах) на 90%.
    • Обеспечил в несколько раз большую проходимость изменений в боевой инфраструктуре (точные цифры не ясны, статистика ранее не велась. Субъективно - изменений стало больше в 5-6 раз).
    • Формализовал и поставил процессы в своей группе (сборная солянка из ITIL и COBIT, скорректированная под наши нужды).
    • Внедрил инструмент управления конфигурацией - ansible, чем обеспечил минимизацию ручной работы на серверах и снижение рисков человеческих ошибок.
    • Выполнил проект по внедрению новой системы мониторинга и проактивных алертов.
    • Обеспечил прозрачность работы группы для топ-менеджмента.
    • Привил коллегам культуру обмена знаниями и их сохранения в документации.
    • Бюджет и контроль его исполнения.
    • Разработал систему грейдирования для службы эксплуатации. Размер оплаты зависит от приносимой ценности и навыков.
    • Проекты по оптимизации внешней инфраструктуры - множество инфраструктурных изменений без незапланированных остановок сервисов.
    • Проекты по оптимизации внутренней инфраструктуры - решил проблемы нерационального использования ресурсов, построив внутреннее облако на базе docker и собственных решений.
    • Тимбилдинг и обучение - инженеры стали командой, способной решать задачи любого уровня сложности.
    • Множество проектов по автоматизации для IT, QA, HR и DEV.

    Стек технологий - java \ php \ .net, bash \ python, postgres \ mssql \ mysql, memcache \ redis, mongodb \ couchbase, nginx \ iis, teamcity \ jenkins, jira, ansible \ chef, docker \ openvz \ vmware esxi, sensu \ zabbix \ nagios, elk \ graphite, pentaho bi, множество внутренних утилит и сервисов.

  • СибНИИуглепроект
    Новокузнецк
    Начальник отдела информационных технологий
    Ноябрь 2011 — Июль 2013 (1 год и 9 месяцев)

    Заботился о бизнесе, процессах и пользователях.

  • Кузнецкая проектная компания
    Новокузнецк
    Системный администратор, затем начальник отдела информационных технологий
    Ноябрь 2007 — Ноябрь 2011 (4 года и 1 месяц)

    Заботился о бизнесе, процессах и пользователях.