Senior Data Scientist (NLP) в автоматизацию коммуникаций

Местоположение и тип занятости

МоскваПолный рабочий деньМожно удаленно

Компания

Международный интернет-магазин одежды, обуви и товаров для дома

Описание вакансии

О компании и команде

Wildberries – это крупнейший маркетплейс России с миллионами пользователей и миллиардами оборота, работающий на рынке 19 лет.

Команда занимается внедрением систем на основе ML & DL решений для автоматизации коммуникаций с пользователями.

Есть возможность принять участие в проектах по автоматизации поддержки для покупателей, продавцов и сотрудников WB. Кроме продуктовой деятельности, можно принять участие в профильных конференциях и во внутреннем обучении для Data Science специалистов.

Сейчас мы ищем Middle+ / Senior NLP Engineers для работы со следующими проектами:

  • Генерация ответов на отзывы и вопросы покупателей о товарах при помощи LLM;
  • Автоматизация первой и второй линии тех. поддержек;
  • Разработка и внедрение агентов с LLM под капотом для автоматизации бизнес-процессов компании.

Ожидания от кандидата

  • Опыт разработки, вывода в прод и поддержки высоконагруженного ML-сервиса с LLM;
  • Опыт в области анализа данных и машинного обучения от 3х лет;
  • Знание Python, методов работы с большими данными;
  • Опыт работы с библиотеками: Scikit-learn, HuggingFace, PyTorch;
  • Опыт работы с LLM (использование для решения бизнес-задач, fine-tuning / обучение);
  • Знание теорий вероятностей и математической статистики;
  • Знание алгоритмов и структур данных.

Что нужно делать

  • Использовать историю взаимодействия с пользователем для улучшения моделей;
  • Создавать и обучать модели машинного обучения и NLP для понимания и обработки текстовых запросов пользователей;
  • Заниматься продуктивизацией решений с LLM под капотом, масштабировать и оптимизировать кодовую инфраструктуру;
  • Участвовать в проектировании архитектуры решений, проводить код-ревью, отвечать за выкатку решений в прод.

Условия работы

  • Интересные задачи, и исследовательские, и прикладные, возможность переключаться между ними и видеть улучшения от них в production;
  • Большие данные, сотни миллионов товаров, миллиарды действий пользователей в день, ресурсы и инфраструктуру, необходимые для работы с ними;
  • Инфраструктура: Мощные GPU-кластеры, петабайты данных;
  • Развитие: Конференции, курсы, внутренние митапы;
  • Гибридный или удаленный формат работы с гибким началом рабочего дня;
  • Бесплатное питание в наших офисах;
  • Скидки на фитнес и образовательные программы.