В качестве прикладных задач мне особенно интересно развиваться в области больших языковых моделей (LLM). В настоящее время я занимаюсь ретривингом и дообучением моделей Llama3, Deepseek и Qwen для того, чтобы они соответствовали потребностям бизнеса, что позволяет улучшить их производительность и применимость в реальных задачах. Для этого я использую фреймворк LangChain.
Одним из интересных для меня направлений является создание мультиагентных систем. Я разрабатываю архитектуру этих систем, оформляю их в виде API и внедряю в телеграм-ботов. Для написания ботов я использую библиотеку aiogram, что позволяет реализовать асинхронное взаимодействие и обеспечить высокую производительность. API я пишу на Django (DRF) либо FastAPI.
Кроме того, я занимаюсь интеграцией моделей и алгоритмов машинного обучения в бэкэнд-системы, что помогает автоматизировать и улучшать бизнес-процессы. Моя работа способствует улучшению функциональности и надежности различных приложений и систем, что положительно сказывается на эффективности работы компании.
На начальном этапе занимался разработкой автоматизации документооборота на python. Разрабатывал архитектуру для сканирования и классификации документов приходящих на почту компании с помощью imap. После реализации этого кейса, начал работу над распознаванием рукописных данных с классифицированных документов, с помощью нейросетей по мультиклассовой классификации и посредством api с разными сервисами распознавания данных. Была разработана технология по сегментации данных на сканированных документах, что повысило точность распознавания данных со сканов до 94%. На данный момент являюсь руководителем направления python-разработки в компании. Сейчас передо мной стоит задача, "дообучения" llm-модели на данных из базы знаний компании, для того, чтобы создать виртуального ассистента, который облегчит работу технической поддержки.
Работы в рамках практики от Университета по программе магистратуры:
В «Газпромнефть НТЦ» занимался разработкой ассистента на базе LLM (Llama, Gigachat) для создания RAG системы. Языковая модель обогащалась данными по нефтегазовой отрасли (учебные материалы, методички, мануалы ПО) для того, чтобы ускорять работу специалистов по гидродинамическому моделированию.
В «Газпромнефть-Хантос» занимался созданием мультиагентной системы для получения актуальной инфоррмации о фонде нефтегазовых скважин. Модель была обогащена данными о структуре таблиц с информацией о добыче. Также была выстроена система из нескольких агентов для создания запроса к Pandas датафрейму с данными, его валидации и визуализации выгрузки в виде диаграмм и графиков.
Я занимался доработкой и оптимизацией API эндпоинтов, обеспечивая стабильную и эффективную работу портала, принимал и обрабатывал задачи от бизнеса. Исправлял ошибки, выявленные технической поддержкой. Кроме того, я самостоятельно разрабатывал новый раздел в портале, включая полный цикл разработки от архитектуры до внедрения и тестирования.
В университете занимаюсь научно-исследовательской работой "Оптимизация положения скважины". С помощью physics-informed нейросетей находим оптимальное положение скважины для увеличения добычи, что в свою очередь приводит к увеличению коэффициента извлечения нефти на месторождении. Отслеживаем изменение пластового давления при бурении как нагнетательных, так и добывающих скважин.
Закончил с красным дипломом. В университете помимо учебы занимаюсь научной деятельностью, развиваю научные проекты на стыке информационных технологий и энергетики, каждый год являюсь получателем стипендий Президента или Правительства РФ, также в 2021 г., получил губернаторскую стипендию, ежегодно участвую во Всероссийских конференциях и занимаю призовые места. Также в 2021 г. участвовал в Саммите молодых ученых в г. Сочи, Сириус.