Data Scientist в команду Horizontal ML NLP

Местоположение и тип занятости

МоскваПолный рабочий деньМожно удаленно

Компания

Международный интернет-магазин одежды, обуви и товаров для дома

Описание вакансии

О компании и команде

Wildberries – это крупнейший маркетплейс России с миллионами пользователей и миллиардами оборота, работающий на рынке уже 20 лет.

Наша компания стабильно развивается и работает в усиленном режиме: использует современный стек и новейшие технологии, разрабатывает множество новых hi-tech продуктов.

Мы ищем Middle+ / Senior Data Scientists в команду Horizontal ML NLP / Recsys. Основная задача - приносить пользу различным продуктам внутри WB. В моменте фокусируемся на кандидатных моделях для рекомендаций, спеллчеке, различных сценариях в поиске и многом другом.

Ожидания от кандидата

  • Понимание принципов работы архитектур нейронных сетей;
  • Уверенный опыт обучения и практического применения современных нейросетевых моделей NLP и рекомендаций на torch;
  • Понимание принципов работы LLM, LoRA;
  • Опыт работы с системами инференса моделей;
  • Опыт классичесого ML, иерархической кластеризации, мультикласс и мультилейбл классификации;
  • Знания фреймворков автоматизации разработки ML-моделей - Airflow/MLFlow;
  • Уверенное владение SQL-подобными базами данных, такими как Postgres, Clickhouse, Greenplum;
  • Наличие публикаций по нейросетевой тематике / опыт выступлений на конференциях / навыки работы с Hadoop, HDFS и Spark будут считаться плюсом.

Что нужно делать

  • Улучшать ранжирование товаров в поиске;
  • Разрабатывать персонализированные user2item и item2item модели рекомендаций;
  • Строить вопросно-ответные системы с помощью LLM;
  • Разрабатывать спеллчекер на основе нейросетей.

Условия работы

  • Интересные задачи, и исследовательские, и прикладные, возможность переключаться между ними и видеть улучшения от них в production;
  • Большие данные, сотни миллионов товаров, миллиарды действий пользователей в день, ресурсы и инфраструктуру, необходимые для работы с ними;
  • Инфраструктура: Мощные GPU-кластеры, петабайты данных;
  • Развитие: Конференции, курсы, внутренние митапы;
  • Гибридный или удаленный формат работы с гибким началом рабочего дня;
  • Бесплатное питание в наших офисах;
  • Скидки на фитнес и образовательные программы.