Виталий Ерохин

Эксперт

Каждый день улучшаю свои скиллы, чтобы решать все более сложные задачи • Ученый по данным • ML разработчик • Старший (Senior)

От 400 000 ₽ • Рассмотрю предложения

Написать

Контакты

Контакты скрыты настройками приватности

Возраст: 25 лет

Опыт работы: 3 года и 7 месяцев

Регистрация: 17.08.2023

Последний визит: 1 день назад

Гражданство:

Местоположение: Россия, Москва

Дополнительно: готов к удаленной работе

Знание языков:

Рекомендательные письма

Друзья

Обо мне

Меня зовут Виталий, и я Data Scientist с более чем 3-летним опытом работы в области машинного обучения и NLP.

Я занимаюсь оптимизацией моделей глубокого обучения, автоматизирую процессы и созданию эффективные пайплайны для различных бизнес-задач.

Я успешно реализовал проекты, которые ускорили процессы анализа и обработки данных в 5-7 раз, а также повысили качество моделей на редких классах на 10-15%.

Моя работа охватывает широкий спектр задач от автоматизации клиентской поддержки до разработки систем предсказания и анализа данных в медицине и маркетплейсах.

Обладаю глубокими знаниями и навыками в Python, Transformers, LLM, PyTorch, Docker, FastAPI, SQL и Git, а также менторским опытом в обучении и наставничестве молодых специалистов.

Навыки

Python

NLP

Deep Learning

PyTorch

ООП

Docker

Git

SQL

Английский язык

Нейронные сети

Эксперт

0консультаций

Работаю с квалификациями

Стажёр • Младший • Средний • Старший

Специализация

Ученый по данным • ML разработчик

Помогаю развивать навыки

Машинное обучение • SQL • Python • Нейронные сети • Git • Docker • PyTorch • Deep Learning • FastAPI • NLP

Работаю с запросами

Начало карьеры или смена профессии: Войти в IT • Смена IT-профессии

Развитие навыков: Учебный план • Развитие навыков

Оценка: Оценка навыков • Оценка портфолио • Проверка резюме • Сколько я стою

Смена работы: Резюме для российского рынка • Подготовка к собеседованию • Тестовое собеседование

Карьерный рост: Карьерная консультация • План карьерного роста • Личный бренд

Помощь с задачей: Помощь с тестовым заданием • Помощь с рабочей задачей • Помощь с проектом

Поддержка и коучинг: Отношения с коллективом • Синдром самозванца • Справиться с выгоранием

Стоимость

2500 ₽/ час

Участие в профсообществах

GitHub
Участвует c августа 2022 (2 года и 4 месяца)
152 вклада в 7 репозиториев, связан с языками:
Jupyter Notebook
Перейти в профиль

Опыт работы

Ecom.tech
4.22
Сервис доставки продуктов и товаров для дома
От 1000 до 5000 сотрудников
Ученый по данным (Старший) • Ведущий специалист по машинному обучению
Апрель 2024 — По настоящее время (9 месяцев)
Создал пайплайн-классификатор + Docker + FastAPI для чата клиентской поддержки с помощью DeBerta, который ускорил среднее время ответа оператора на вопрос в 5 раз.
Разработал пайплайн Intent MultiLabelClassification с помощью DeBerta для автоматического предсказания "трендов" пользователя. Это позволило ускорить процесс расчёта NPS в ~7 раз (было 7-14 мин, стало 1-2 мин)
Использовал алгоритмы текстовых аугментаций с помощью LM и LLM моделей - Saiga\llama3, RuT5, RuBert, fasttext, Translation models. Подобные аугментации улучшили качество модели на редких классах на 10-15%
Python • NLP • Deep Learning • PyTorch • Обработка естественного языка • Машинное обучение • Git • SQL • FastAPI • Docker
1T Studio
Москва
Ученый по данным (Старший) • Специалист по "Data Science"
Апрель 2022 — По настоящее время (2 года и 9 месяцев)
-Дообучил большую языковую модель (LLM Llama 2) для реализации чат-бота тех.поддержки
Fine-Tuning LLM моделей и Diffusion моделей для создания уникального контента для пользователя
Разработал пайплайн для сервиса генерации субтитров к видео с помощью Speech2Text модели с выводом в prod
Разработал пайплайн семантического поиска категорий товаров маркетплейсов основываясь на эмбеддингах SBERT\RUBERT, косинусной близости и FAISS
Разработал пайплайн машинного обучения для предсказания температуры системы кондиционирования, что позволило существенно ускорить процессы измерения показаний в процессе использования системы
С нуля разработал и преподавал в компании обучающие курсы Data Science
Произвожу менторинг стажёров и Junior специалистов по DS в компании

---------------------------------------------------------------------------------------------

Сейчас нахожусь на подработке. Веду лекции по Data Science для студентов на курсе
Python • NLP • Машинное обучение • Нейронные сети • Deep Learning • PyTorch • SQL • Git • Docker • FastAPI
Budu
MedTech-сервис по управлению здоровьем
От 100 до 1000 сотрудников
Ученый по данным (Средний) • Специалист по машинному обучению
Ноябрь 2023 — Апрель 2024 (6 месяцев)
Разработал ИИ-ассистента технической поддержи, который сократил время ответа пользователю на 30%. ИИ-ассистент содержит в себе пайплайн из нескольких классификационных моделей RuBERT, которые выполняют первичную фильтрацию сообщений пользователя и автоматический шаблонный ответ для юзера.
Создал гео-аналитический пайплайн для упрощения первичного анализа
Разработал и дообучил BERT-модель для задачи sentence-pair classification, которая позволила решить проблему автоматического мэтчинга медицинских услуг
Дообучил LLM модель Saiga-Mistral для задачи text autocompletion в помощь операторам технической поддержки. Это ускорило среднее время ответа на 30%.
Разработал Speech2Text + NLP Pipeline для медицинских аудио-консультаций. На вход приходили записи аудио-консультаций врача и пациента. На выход получали некоторый критерий оценки врача о том "как хорошо" прошла консультация. Это позволило точечно влиять на качество отдельных аудио-консультаций
Python • Deep Learning • Машинное обучение • Нейронные сети • PyTorch • NLP • Git • SQL • Docker • FastAPI
SkillFactory
4.15
Обучаем Python, Data Science, Machine Learning, разработке и управлению продуктами
От 10 до 100 сотрудников
Ученый по данным (Средний) • Ментор-наставник на курсе по Анализу естественного языка (NLP) (Подработка)
Сентябрь 2023 — Ноябрь 2023 (3 месяца)
Проверка и ревью практических работ студентов. В рамках проверки, я даю полезные советы студентам по тому, как можно улучшить их подходы.
Консультирование студентов в корпоративном мессенджере (Пачка) по их техническим вопросам
Python • Git • SQL • ООП • NLP • Машинное обучение • Нейронные сети • PyTorch • Обработка естественного языка • Deep Learning
Яндекс Практикум
Москва
Ученый по данным (Младший) • Обучение
Июнь 2021 — Февраль 2022 (9 месяцев)
С помощью нейронной сети от Google - BERT и инструментов машинного обучения (PyTorch,CatBoost,LGBM,Sklearn) создал алгоритм определения токсичных комментариев с 95% точностью (f-score)
Разработал прототип модели машинного обучения для компании «Цифра», которая предсказывает коэффициент восстановления золота из золотосодержащей руды с минимальной ошибкой sMAPE - 8,7% за счёт использования модели CatBoost.
Построил модель машинного обучения на основе CatBoost для предсказания количества заказов такси на следующий час. За счёт корректной предобработки данных и настройки модели повысил точность предсказаний в 2,5 раза по сравнению с константной математической моделью
Python • Машинное обучение • Нейронные сети • Deep Learning • PyTorch • Git • SQL • Linux • NLP • Keras
ПрогрессТех (КЦ BOEING)
Ученый по данным (Стажёр) • Техник (Stress-Analyst)
Май 2021 — Февраль 2022 (10 месяцев)
Обязанности:

Рассчитывал и анализировал агрегаты самолёта на прочность с помощью Python и математического аппарата.
Обучал стажёров азам физики и высшей математики

Достижения:

Предложил и внедрил небольшую программу для автоматизации анализа некоторых агрегатов конструкций, что помогло ускорить на 20% выполнение расчётных операций для проекта.
Произвёл анализ недоработанной конструкции и выдал рекомендации по её улучшению.
Python • Linux • Git

Высшее образование

МАИ (НИУ)
Московский Авиационный Институт (Национальный исследовательский университет)
Москва • 3619 выпускников
Авиационной техники
Сентябрь 2017 — Февраль 2023 (5 лет и 5 месяцев)
Кафедра самолето-вертолетостроение, с огромным количеством физики, математики и точных наук

Дополнительное образование

Coursera
Онлайн-обучение от ведущих мировых университетов
2946 выпускников
Generative AI with Large Language Models
Май 2023 — Июль 2023 (2 месяца)
Python • NLP • Обработка естественного языка • Нейронные сети • Deep Learning • PyTorch • Машинное обучение
Stepik
Образовательная платформа и конструктор онлайн-курсов
Санкт-Петербург • 7700 выпускников
Введение в соревновательный Data Science
Февраль 2023 — Апрель 2023 (2 месяца)
Python • Машинное обучение • Нейронные сети • Обработка естественного языка • Deep Learning
Интерактивный тренажер по SQL
Июнь 2022 — Август 2022 (2 месяца)
SQL

Виталий Ерохин

Контакты

Обо мне

Навыки

Эксперт

Работаю с квалификациями

Специализация

Помогаю развивать навыки

Работаю с запросами

Участие в профсообществах

Опыт работы

Высшее образование

МАИ (НИУ)

Дополнительное образование

Coursera

Stepik