🤠 Бэкендеры, найдите себе команду по вайбам! Проверить мэтч → в вайб-квизе
Виталий Ерохин (erokhinvi), 25 лет, Россия, МоскваВиталий Ерохин (erokhinvi), 25 лет, Россия, Москва

Виталий Ерохин

Эксперт
Каждый день улучшаю свои скиллы, чтобы решать все более сложные задачиУченый по даннымML разработчикСтарший (Senior)
От 400 000 ₽Рассмотрю предложения

Контакты

Контакты скрыты настройками приватности
Возраст: 25 лет
Опыт работы: 3 года и 6 месяцев
Регистрация: 17.08.2023
Последний визит: 2 недели назад
Гражданство:
Местоположение: Россия, Москва
Дополнительно: готов к удаленной работе
Знание языков:

Обо мне

Меня зовут Виталий, и я Data Scientist с более чем 3-летним опытом работы в области машинного обучения и NLP. 

Я занимаюсь оптимизацией моделей глубокого обучения, автоматизирую процессы и созданию эффективные пайплайны для различных бизнес-задач.

Я успешно реализовал проекты, которые ускорили процессы анализа и обработки данных в 5-7 раз, а также повысили качество моделей на редких классах на 10-15%. 

Моя работа охватывает широкий спектр задач от автоматизации клиентской поддержки до разработки систем предсказания и анализа данных в медицине и маркетплейсах. 

Обладаю глубокими знаниями и навыками в Python, Transformers, LLM, PyTorch, Docker, FastAPI, SQL и Git, а также менторским опытом в обучении и наставничестве молодых специалистов.

Навыки

Python
NLP
Deep Learning
PyTorch
ООП
Docker
Git
SQL
Английский язык
Нейронные сети

Эксперт

0консультаций

Работаю с квалификациями

СтажёрМладшийСреднийСтарший

Помогаю развивать навыки

Машинное обучениеSQLPythonНейронные сетиGitDockerPyTorchDeep LearningFastAPINLP
Стоимость
2500 ₽/ час

Участие в профсообществах

Опыт работы

  • Сервис доставки продуктов и товаров для дома
    От 1000 до 5000 сотрудников
    Ученый по данным (Старший)Ведущий специалист по машинному обучению
    Апрель 2024 — По настоящее время (8 месяцев)
    • Создал пайплайн-классификатор + Docker + FastAPI для чата клиентской поддержки с помощью DeBerta, который ускорил среднее время ответа оператора на вопрос в 5 раз.
    • Разработал пайплайн Intent MultiLabelClassification с помощью DeBerta для автоматического предсказания "трендов" пользователя. Это позволило ускорить процесс расчёта NPS в ~7 раз (было 7-14 мин, стало 1-2 мин)
    • Использовал алгоритмы текстовых аугментаций с помощью LM и LLM моделей - Saiga\llama3, RuT5, RuBert, fasttext, Translation models. Подобные аугментации улучшили качество модели на редких классах на 10-15%
  • 1T Studio
    Москва
    Ученый по данным (Старший)Специалист по "Data Science"
    Апрель 2022 — По настоящее время (2 года и 8 месяцев)
    • -Дообучил большую языковую модель (LLM Llama 2) для реализации чат-бота тех.поддержки
    • Fine-Tuning LLM моделей и Diffusion моделей для создания уникального контента для пользователя
    • Разработал пайплайн для сервиса генерации субтитров к видео с помощью Speech2Text модели с выводом в prod
    • Разработал пайплайн семантического поиска категорий товаров маркетплейсов основываясь на эмбеддингах SBERT\RUBERT, косинусной близости и FAISS
    • Разработал пайплайн машинного обучения для предсказания температуры системы кондиционирования, что позволило существенно ускорить процессы измерения показаний в процессе использования системы
    • С нуля разработал и преподавал в компании обучающие курсы Data Science
    • Произвожу менторинг стажёров и Junior специалистов по DS в компании

    ---------------------------------------------------------------------------------------------

    Сейчас нахожусь на подработке. Веду лекции по Data Science для студентов на курсе

  • MedTech-сервис по управлению здоровьем
    От 100 до 1000 сотрудников
    Ученый по данным (Средний)Специалист по машинному обучению
    Ноябрь 2023 — Апрель 2024 (6 месяцев)
    • Разработал ИИ-ассистента технической поддержи, который сократил время ответа пользователю на 30%. ИИ-ассистент содержит в себе пайплайн из нескольких классификационных моделей RuBERT, которые выполняют первичную фильтрацию сообщений пользователя и автоматический шаблонный ответ для юзера.
    • Создал гео-аналитический пайплайн для упрощения первичного анализа
    • Разработал и дообучил BERT-модель для задачи sentence-pair classification, которая позволила решить проблему автоматического мэтчинга медицинских услуг
    • Дообучил LLM модель Saiga-Mistral для задачи text autocompletion в помощь операторам технической поддержки. Это ускорило среднее время ответа на 30%.
    • Разработал Speech2Text + NLP Pipeline для медицинских аудио-консультаций. На вход приходили записи аудио-консультаций врача и пациента. На выход получали некоторый критерий оценки врача о том "как хорошо" прошла консультация. Это позволило точечно влиять на качество отдельных аудио-консультаций
  • Обучаем Python, Data Science, Machine Learning, разработке и управлению продуктами
    От 10 до 100 сотрудников
    Ученый по данным (Средний)Ментор-наставник на курсе по Анализу естественного языка (NLP) (Подработка)
    Сентябрь 2023 — Ноябрь 2023 (3 месяца)
    • Проверка и ревью практических работ студентов. В рамках проверки, я даю полезные советы студентам по тому, как можно улучшить их подходы.
    • Консультирование студентов в корпоративном мессенджере (Пачка) по их техническим вопросам
  • Яндекс Практикум
    Москва
    Ученый по данным (Младший)Обучение
    Июнь 2021 — Февраль 2022 (9 месяцев)
    • С помощью нейронной сети от Google - BERT и инструментов машинного обучения (PyTorch,CatBoost,LGBM,Sklearn) создал алгоритм определения токсичных комментариев с 95% точностью (f-score)
    •  Разработал прототип модели машинного обучения для компании «Цифра», которая предсказывает коэффициент восстановления золота из золотосодержащей руды с минимальной ошибкой sMAPE - 8,7% за счёт использования модели CatBoost.
    • Построил модель машинного обучения на основе CatBoost для предсказания количества заказов такси на следующий час. За счёт корректной предобработки данных и настройки модели повысил точность предсказаний в 2,5 раза по сравнению с константной математической моделью
  • ПрогрессТех (КЦ BOEING)
    Ученый по данным (Стажёр)Техник (Stress-Analyst)
    Май 2021 — Февраль 2022 (10 месяцев)

    Обязанности:

    • Рассчитывал и анализировал агрегаты самолёта на прочность с помощью Python и математического аппарата.
    • Обучал стажёров азам физики и высшей математики

    Достижения:

    • Предложил и внедрил небольшую программу для автоматизации анализа некоторых агрегатов конструкций, что помогло ускорить на 20% выполнение расчётных операций для проекта.
    • Произвёл анализ недоработанной конструкции и выдал рекомендации по её улучшению.
    PythonLinuxGit

Высшее образование

  • МАИ (НИУ)

    Московский Авиационный Институт (Национальный исследовательский университет)
    Авиационной техники
    Сентябрь 2017 — Февраль 2023 (5 лет и 5 месяцев)

    Кафедра самолето-вертолетостроение, с огромным количеством физики, математики и точных наук

Дополнительное образование