Илья Петров (gromobo9), 25 лет, Россия, ВоронежИлья Петров (gromobo9), 25 лет, Россия, Воронеж
Дата саентист с большим опытом в сфере разработки и спортивного программировнияУченый по даннымML разработчикСредний (Middle)
От 300 000 ₽Ищу работу

Контакты

Войти
Возраст: 25 лет
Опыт работы: 4 года
Регистрация: 10.02.2025
Последний визит: 1 неделю назад
Гражданство: Россия
Местоположение: Россия, Воронеж
Дополнительно: готов к переезду и к удаленной работе
Знание языков: Английский В2

Обо мне

Ответственен, целеустремлен, умею вести диалог и находить различного рода решения к новым задачам, а также предлагать свои идеи для улучшения к текущим.

telegram: @kkk145


В свободное время занимаюсь спортом, путешествую, а также участвую в различного рода хакатонах, связанных с машинным обучением и NLP.


Мои призовые места:


Цифровой прорыв:


  • 2 место в хакатоне "Анализ качества преподавания" от GeekBrains (занимался созданием полноценного продукта, позволяющего при помощи NLP суммаризировать и оценивать уроки)
  • 3 место в хакатоне "ИИ помогает фермерам" от Плант Бокс (реализовывал чат бот, позволяющий отвечать на вопросы пользователей от различных растениях, используя LLAMA и векторные БД)
  • 5 место в хакатоне "Анализ текста" от РБК (собирал различного рода фичи для статей и на их основе предсказывал, какой процент текста прочтет пользователь и какое количество просмотров будет у статьи)

ZavodIT:


  • 1 место в хакатоне "Цифровой помощник юриста" от ЮБ «Компонента» (реализовывал NLP модель, которая способна заполнять юридические документы на основе введенных пользователем данных, используя LLAMA)
  • 2 место в хакатоне "Автоматизация разбора платежей" от BIV (дообучил и оптимизировал модель на классификацию платежей по их текстовому описанию, используя BERT и ONNX)
  • 3 место в хакатоне "Алгоритм для структурирования информации в резюме кандидатов" от Sense Group (дообучил модель LLAMA на задачу структуризации резюме по его описанию)
  • 3 место в хакатоне "Суммаризация комментариев в социальных медиа" от Brand Analytics (дообучил модель T5 на задачу суммаризации комментариев)

Навыки

Flask
SQL
Python
Git
Английский язык
Docker
Kubernetes
Apache Airflow
Математическая статистика
Postman
FastAPI

Опыт работы

  • NetCracker Technology Corp. (Россия)
    Ученый по данным (Средний)Data Scientist
    Август 2021 — Декабрь 2024 (3 года и 5 месяцев)

    Список обязанностей на моей работе:

    • Данные: занимался сбором данных, очисткой, разметкой, аугментацией и визуализацией.
    • Модели: обучал, валидировал, оптимизировал модели машинного обучения для легкого выхода в продакшен.
    • Разработка: занимался написанием backend части приложения, создавая сервис (REST API) под модели машинного обучения.
    • Бизнес логика: в каждой задаче проходил полный цикл от формулировки задачи, бизнес идеи и оценки времени выполнения до практической реализации в виде интегрируемого сервиса.
    • Презентации и отчётность: презентовал идеи и отчеты по разработке на русском и английском языках, вел собрания с внешними заказчиками, формируя требования к задаче.

    Задачи:

    • Разработал NLP сервис для шифрования персональных данных в пользовательских текстовых документах (docx, excel, txt, csv и т.д.): Обучил NLP модель (bert) для поиска чувствительной информации в тексте, написал бэкенд для получения, чтения, обработки и шифрования данных. (transformers, docker, fast api, mlflow, pytest, openpyxl, csv, postgresql, onnx)
    • Разработал NLP сервис, позволяющий заниматься анонимизацией и де-анонимизацией пользовательских данных: сервис позволяет анонимизировать отправку пользовательских сообщений/данных в GPT API, а также де-анонимизировать ответ от GPT, сохраняя контекст и структурность диалога. Используется в задаче AI Agent. (transformers, docker, kubernetes, pytest, flask, postgresql )
    • Работал над задачей Churn Rate (задача оттока): составлял бизнес определение самого оттока, изучал паттерны и смысловые цепочки, свойственные клиентам, склонным к оттоку (визуализация деревьев). Разрабатывал алгоритм классификации, чтобы определить "уйдет" ли клиент или "останется". (mlflow, catboost, random forest)
    • Составлял статистические отчеты по данным клиентов: выгрузка данных из базы, статистика, визуализация, оркестровка отчетов. (sql, pandas, scikit learn, plotly, matplotlib, airflow)
    Ученый по данным (Стажёр)Data Scientist (стажер)
    Январь 2021 — Август 2021 (8 месяцев)

    Участвовал в соревнованиях от компании, чтобы пройти на должность инженера по машинному обучению. Решал различного рода классические задачи такие как:

    • регрессия
    • классификация
    • кластеризация

Высшее образование

  • ВГУ

    Воронежский государственный университет
    Воронеж2190 выпускников
    Математический
    Сентябрь 2021 — Август 2024 (2 года и 11 месяцев)

    Степень: Магистр

    Направление: Математика и компьютерные науки

    Кафедра: Кафедра функционального анализа

    Компьютерных наук
    Сентябрь 2017 — Август 2021 (3 года и 11 месяцев)

    Степень: Бакалавр

    Направление: Математика и компьютерные науки

    Распределение: Искусственный интеллект