Senior Data Scientist (NLP) в автоматизацию коммуникаций
Требования
Местоположение и тип занятости
Компания
Международный интернет-магазин одежды, обуви и товаров для дома
Описание вакансии
О компании и команде
Wildberries – это крупнейший маркетплейс России с миллионами пользователей и миллиардами оборота, работающий на рынке 19 лет.
Команда занимается внедрением систем на основе ML & DL решений для автоматизации коммуникаций с пользователями.
Есть возможность принять участие в проектах по автоматизации поддержки для покупателей, продавцов и сотрудников WB. Кроме продуктовой деятельности, можно принять участие в профильных конференциях и во внутреннем обучении для Data Science специалистов.
Сейчас мы ищем Middle+ / Senior NLP Engineers для работы со следующими проектами:
- Генерация ответов на отзывы и вопросы покупателей о товарах при помощи LLM;
- Автоматизация первой и второй линии тех. поддержек;
- Разработка и внедрение агентов с LLM под капотом для автоматизации бизнес-процессов компании.
Ожидания от кандидата
- Опыт разработки, вывода в прод и поддержки высоконагруженного ML-сервиса с LLM;
- Опыт в области анализа данных и машинного обучения от 3х лет;
- Знание Python, методов работы с большими данными;
- Опыт работы с библиотеками: Scikit-learn, HuggingFace, PyTorch;
- Опыт работы с LLM (использование для решения бизнес-задач, fine-tuning / обучение);
- Знание теорий вероятностей и математической статистики;
- Знание алгоритмов и структур данных.
Что нужно делать
- Использовать историю взаимодействия с пользователем для улучшения моделей;
- Создавать и обучать модели машинного обучения и NLP для понимания и обработки текстовых запросов пользователей;
- Заниматься продуктивизацией решений с LLM под капотом, масштабировать и оптимизировать кодовую инфраструктуру;
- Участвовать в проектировании архитектуры решений, проводить код-ревью, отвечать за выкатку решений в прод.
Условия работы
- Интересные задачи, и исследовательские, и прикладные, возможность переключаться между ними и видеть улучшения от них в production;
- Большие данные, сотни миллионов товаров, миллиарды действий пользователей в день, ресурсы и инфраструктуру, необходимые для работы с ними;
- Инфраструктура: Мощные GPU-кластеры, петабайты данных;
- Развитие: Конференции, курсы, внутренние митапы;
- Гибридный или удаленный формат работы с гибким началом рабочего дня;
- Бесплатное питание в наших офисах;
- Скидки на фитнес и образовательные программы.