Дмитрий Ширшов (dimensionkernel), 23 года, Россия, МоскваДмитрий Ширшов (dimensionkernel), 23 года, Россия, Москва

Дмитрий Ширшов

Эксперт
Senior Data & AI Engineer | Spark · Kafka · Flink · LLM · RAG · AgenticБэкенд разработчикAI Software EngineerСтарший (Senior)
От 500 000 ₽Не ищу работу
Поднимите резюме с подпиской Бустер

Контакты

Войти
Возраст: 23 года
Опыт работы: 3 года и 2 месяца
Регистрация: 21.12.2022
Последний визит: 1 месяц назад
Гражданство: Россия
Местоположение: Россия, Москва
Дополнительно: готов к переезду и к удаленной работе
Знание языков: Английский С1Русский родной язык

Обо мне

Ссылка на моё полное резюме на русском (обновлено 15.07.2025): клик
Мой Github с личными проектами: ShirshovDIM

Senior Data & AI Engineer с опытом 4+ лет в построении production-систем в Альфа-Банке и Сбербанке.

В Альфа-Банке отвечаю за стек AI-автоматизации инженерных процессов:
• Сервис аномалий для пайплайнов данных — охватывает ~200 бизнес-таблиц; время реакции на инцидент снижено с ~1 рабочего дня до ~4 часов (~75%).
• Агент автоматизации DWH-миграций — сокращение TTM задачи с 10 рабочих дней до 1 дня (~90%); 154 бизнес-сущности мигрированы за первый месяц.
• Агентский ассистент code-review — обрабатывает ~4 PR/день на репозиторий; 70% замечаний принимаются разработчиками.

На стороне data engineering: батчевые и стриминговые пайплайны с объёмом 200 ГБ–1 ТБ/день (Spark, Flink CDC, Kafka, Airflow, ClickHouse, Oracle, Greenplum, K8S).

В Сбербанке CIB разработал OCR-систему для извлечения текста из документов — ~10 000 документов за batch-запуск, точность извлечения ~73%.

Open-source: контрибьютор Fooocus (диффузионные модели). Сооснователь QuadForge — AI-движок для 3D-ретопологии (LLM + VLM + Multimodal RAG + MCP).

Магистратура «Искусственный интеллект» @ Университет ИТМО (в процессе). Бакалавр по Data Science @ РАНХиГС, GPA 4.6/5.0.

Регулярно занимаюсь самообучением. Открыт к позициям Senior / Lead Data & AI Engineer — удалённо или гибридно.

Навыки

Выберите навык, чтобы посмотреть, какие тесты специалист уже прошел.

Python
Scala
LLM
PostgreSQL
SQL
Apache Kafka
Apache Spark
Apache Hadoop
Docker
Машинное обучение
Нейронные сети
Apache Flink
ClickHouse
Kubernetes

Эксперт

8консультаций
5
6 оценок

Работаю с квалификациями

СтажёрМладший

Помогаю развивать навыки

ООПScalaSQLPythonPostgreSQLGitApache SparkApache HadoopApache KafkaApache Airflow

Экспертность

Senior Data & AI Engineer с опытом 4+ лет в production-системах Альфа-Банка и Сбербанка CIB.

В Альфа-Банке отвечаю за полный стек AI-автоматизации: сервис аномалий для data-пайплайнов, агент автоматизации DWH-миграций, агентский ассистент code-review. Строю и поддерживаю батчевые и стриминговые пайплайны (200 ГБ–1 ТБ/день): Spark, Flink CDC, Kafka, Airflow, ClickHouse, Oracle, Greenplum, K8S.

Менторство: https://teacher.army/

Специализация: автоматизация бизнес-процессов с LLM/RAG/Agentic-стеком, разработка пайплайнов потоковой/батчевой обработки данных, проектирование DWH. Помогаю входить в Data Engineering, разбираться с Spark/Kafka/Flink, строить карьеру в DE/DS/MLOps.

Стоимость
4000 ₽/ час
Первая встреча бесплатно

Опыт работы

  • Аппаратные и цифровые технологии (ООО «АЦТ»)
    Москва
    ML разработчик (Старший)Разработчик (по совместительству)
    Сентябрь 2025 — По настоящее время (8 месяцев)
  • Digital-подразделение Альфа-Банка
    МоскваБолее 5000 сотрудников
    ML разработчик (Старший)Senior AI Automation Engineer
    Декабрь 2024 — По настоящее время (1 год и 5 месяцев)
    • Построение и поддержка стека AI-автоматизации инженерных процессов в Альфа-Банке (один из топ-3 банков России по активам).

    Ключевые достижения:

    • Сервис аномалий для data-пайплайнов: охват ~200 бизнес-таблиц из ~1 000 доступных; время ответа на инцидент сокращено с ~1 рабочего дня до ~4 часов (~75%).
    • Агент автоматизации DWH-миграций: сокращение TTM задачи с 10 рабочих дней до 1 дня (~90%); 154 бизнес-сущности мигрированы за первый месяц.
    • Агентский ассистент code-review: обрабатывает ~4 PR/день на репозиторий; 70% замечаний принимаются разработчиками.

    Стек: Python · LLM · RAG · Agentic Workflows · Agentic Memory · OpenAI Agents SDK · Anthropic SDK · LangChain · LangGraph · Kubernetes

    Инженер по данным (Средний)Data Engineer
    Март 2024 — Декабрь 2024 (10 месяцев)

    Разработка и поддержка data-пайплайнов и ETL/ELT-процессов для корпоративной инфраструктуры Альфа-Банка.

    Ключевые задачи и достижения:

    • Построение и поддержка батчевых пайплайнов с объёмом обработки до ~200 ГБ/запуск (Spark, Airflow, Oracle, Greenplum, ClickHouse, S3/Iceberg LakeHouse).
    • Разработка Flink CDC стриминговых приложений для CDC; пропускная способность до ~1 ТБ сообщений/день.
    • Деплой и эксплуатация пайплайнов на Kubernetes (K8S); REST и Swagger API интеграции.
    • Работа с OLAP и транзакционными слоями: Oracle, Greenplum, ClickHouse, S3/Iceberg.
    • Участие в разработке компонент маскирования данных и валидации бизнес-логики ETL.
    • Техническое собеседование кандидатов; наставничество в рамках внутреннего центра компетенций.

    Стек: Python · SQL · Spark · Flink · Kafka · Airflow · Oracle · Greenplum · ClickHouse · Bash · Swagger · OLAP · K8S · Git

  • Крупнейшая цифровая платформа. Технобренд, объединяющий лучшие мировые практики и самый современный стек
    МоскваБолее 5000 сотрудников
    Бэкенд разработчик (Средний)Middle Python/Scala Developer (Sberbank CIB)
    Октябрь 2023 — Март 2024 (6 месяцев)

    Backend data engineering и разработка распределённых систем в Sberbank CIB (инвестиционное подразделение Сбербанка).

    Ключевые задачи и достижения:

    • Построение масштабируемых пайплайнов распределённой обработки данных: Scala, Spark, Kafka на enterprise-уровне.
    • Разработка OCR-системы для автоматического извлечения текста из документов (~10 000 документов за batch-запуск; эмпирическая точность извлечения ~73%).
    • Реализация REST и gRPC микросервисов; сборка через Maven.
    • Участие в разработке пайплайнов загрузки графовых эмбеддингов.
    • Внедрение логики расчёта транзитивных цепочек с адаптивной глубиной связи.
    • Переработка и улучшение логики логирования в основном рабочем фреймворке.
    • Самостоятельная сборка релизов.

    Стек: Scala · Python · Spark · Kafka · Maven · Bash · REST · gRPC · Flink · SQL · Git · Linux

    ScalaPythonApache KafkaApache SparkSQLBashGitLinuxRESTApache Flink
    Ученый по данным (Средний)Middle Data Scientist (Sberbank CIB)
    Август 2023 — Сентябрь 2023 (2 месяца)

    Прикладной Machine Learning и Data Science в Sberbank CIB, фокус — разработка production ML-моделей.

    Ключевые задачи и достижения:

    • Ответственность за разработку OCR-системы для автоматического извлечения текста из документов: ~10 000 документов за batch-запуск, эмпирическая точность извлечения ~73% (измерено на hold-out выборках).
    • Применение алгоритмов ML (классификация, регрессия) к банковским наборам данных.
    • Участие в пайплайне productionization моделей; code review и рабочие процессы оценки моделей.
    • Проверка кода на соответствие дизайну для ML-моделей на основе документации.
    • Участие в разработке валидационного фреймворка на Python.

    Стек: Python · Machine Learning · OCR · Scikit-learn · Pandas · NumPy · SQL · Git · PostgreSQL · Kafka · Spark

    Ученый по данным (Младший)Junior Data Scientist (Sberbank)
    Март 2023 — Июль 2023 (5 месяцев)

    Первая профессиональная роль в Data Science — применение ML-методов к реальным банковским данным, OCR-системы и автоматизация обработки документов.

    Ключевые задачи:

    • Распознавание информации из ~12 000 документов нотариальных доверенностей с использованием OCR.
    • Доработка алгоритма для распознавания информации из страховых полисов «Сберстрахования».
    • Настройка Apache Spark для работы с Greenplum на кластере.
    • Разработка утилиты для перекладки архивированных CSV-файлов в требуемую файловую систему.

    Стек: Python · Machine Learning · OCR · PostgreSQL · Apache Spark · Git · Docker

Высшее образование

  • Институт прикладных компьютерных наук
    Август 2025 — По настоящее время (8 месяцев)

    Студент ITMO AI Talent Hub по направлению подготовки "Искусственный Интеллект" (11.04.02 - Инфокоммуникационные технологии и системы связи)

  • Институт экономики, математики и информационных технологий
    Сентябрь 2021 — Июль 2025 (3 года и 10 месяцев)

    Студент программы, охватывающей как классические экономические и специальные математические дисциплины, так и предметную область, связанную с машинным обучением, нейронными сетями и базами данных 

    Направление подготовки "Цифровая экономика"  (38.03.01 - Экономика)

Дополнительное образование

  • Apache Spark для задач дата инжиниринга
    Январь 2024 — Март 2024 (2 месяца)
    Apache Spark для задач Data Science
    Июнь 2023 — Июль 2023 (1 месяц)

    Итоговой работой в рамках курса была реализация полного ELT-пайплайна загрузки из kafka в PG.  Для одного из промежуточных слоев трансформаций была написана несложная рекомендательная модель. 

    Результат итоговой работы - таблицы в PG из стороннего источника (в моем случае БС был Kafka). Среди таблиц - сущность с эмбеддингами, сущность с рекомендациями для пользователя  

    Рекомендательные системы
    Июнь 2023 — Июль 2023 (1 месяц)