Марк Аверченко (marcenavuc1), 23 года, Россия, ЕкатеринбургМарк Аверченко (marcenavuc1), 23 года, Россия, Екатеринбург

Марк Аверченко

Превращаю модельки из ноутбуков в продакш решениеMachine learning engineerСредний (Middle)
Не ищу работу

Контакты

Войти
Возраст: 23 года
Опыт работы: 4 года и 9 месяцев
Регистрация: 25.07.2022
Последний визит: 4 дня назад
Гражданство:
Местоположение: Россия, Екатеринбург
Знание языков:

Навыки

Git
Python
Базы данных
Linux
Docker
Kubernetes
Apache Airflow
Apache Spark
SQL

Участие в профсообществах

Опыт работы

  • Разработка, внедрение и обслуживание сложных программных решений мирового уровня
    МоскваОт 100 до 1000 сотрудников
    Machine learning engineer
    Декабрь 2021 — По настоящее время (3 года и 1 месяц)
    • Разрабатывал рекомендательную систему для оптимизации бюджета на рекламу в Google adsense, Facebook ads manager, LinkedIn ads. Добавлял новые таски в пайпайн обработки данных, фиксил баги, добавлял новые источники данных
    • Stack: AWS, Docker, alembic, sqlalchemy, pandas, numpy
    • Работал над BI-системой для Cinimex HR. Я разработал хранилище данных для получения данные из нескольких источников данных и хранение этих данных в общем виде в базе данных. Также я настроил apache airflow в продакшн моде для задач по обработке данных и etl.
    •  Stack: Postgres, Airflow, Docker, GitLab
    • Разрабатывал антифрод систему дли одного из топ 5 банков России. Вывел в продакшн несколько релизов пайплайна сбора фичей для модели машинного обучения, которая скорила транзакции на предмет их мошенничества. Так же при разработке пайплайнов я уменьших использование памяти и время работы в пайплайнеСтек: Даск, Панды, Докер, Xgboost
    • Stack: Dask, Pandas, Docker, Xgboost
    • Работал над крупнейшей системой лотерей в России. Я мигрировал
      весь пайплайн обработки данных в SberCloud. Настроил спарк на kubernetes,
    • Stack: Spark, Kubernetes(k8s), Docker, Pandas, LightGBM
  • Крупнейшая цифровая платформа. Технобренд, объединяющий лучшие мировые практики и самый современный стек
    ЕкатеринбургБолее 5000 сотрудников
    MLOps
    Июнь 2021 — Декабрь 2021 (7 месяцев)
    • Создал модель глубокого обучения nlp для прогнозирования переговоров между местными и иностранными компаниями. Эта модель имела актуальный и ощутимый финансовый эффект. Стек моделей: deeppavlov, fasttext, razdel, nltk
    • Вывел в продакшн 3 витрины данных для ml моделей с apache spark, hdfs. Эти витрины данных работают через oozie таски и обрабатывают террабайтные данных каждый день
    • Зарефакторил и развернул 2 модели машинного обучения для банковских услуг в производственной среде. Эти модели также работают с apache oozie.
    • Используемые для развертывания моделей технологии spark, hdfs, hive, jenkins, oozie
    • Также проходил курс по data engineering, где изучал spark, kafka, elasticsearch, postgre
  • УрФУ
    Екатеринбург
    Тимлид исследовательской группы
    Сентябрь 2020 — Декабрь 2020 (4 месяца)

    Работал с Болковым М.А. над анализом дефицита гена HOIL1 и создал пайплайн для повторения результатов. Наше решение предполагало загрузку и дальнейшую параллельную обработку данных с использованием широко используемых методов: GSEA, ORA, графы KEGG, сети PP

    Фреймворки: Snakemake, gage, renv, cemi tool, topGO, ggplot2

    Ссылка на проект

    https://github.com/marcenavuc/hoil1

    Тимлид исследовательской группы
    Февраль 2020 — Май 2020 (4 месяца)

    Работал с Ушениным К.С. и Курсанов А.Г. для создания пайплайна, в который поступает ввод из последовательностей генов и производит филогенетическое дерево. Наше решение может анализировать набор статей и вытащить из них индексы RefSeq, GenBank, UniProt. Затем, используя эти индексы загружают последовательность геномов и строят филогенетические деревья. Наше решение поддерживает несколько способов визуализации данных

    Фреймворки: Docker, Snakemake, R, ggtree, nexus, clustalw, biopython

    Ссылка на проект

    https://github.com/KonstantinUshenin/urfu_bioinf_2020

    Исследователь
    Август 2019 — Февраль 2020 (7 месяцев)

    Работал с Ушениным К.С. и Соловьева О. Создал алгоритм, который ищет

    аномалий в популяциях математических моделей кардиомиоцитов.

    По результатам работы мы придумали решение, позволяющее выявить

    маргинальное поведение математических моделей электрофизиологии

    кардиомиоциты и нейроны

    Фреймворки: myokit, Keras, sklearn, numpy, pandas, matplotlib, seaborn

    Ссылка на статью

    https://aip.scitation.org/doi/10.1063/5.0032246

Высшее образование

  • УрФУ им. Б.Н. Ельцина

    Уральский Федеральный Университет имени первого президента России Б.Н. Ельцина
    Екатеринбург4689 выпускников
    Институт естественных наук и математики
    Сентябрь 2019 — По настоящее время (5 лет и 3 месяца)

    Математика и компьютерные науки