🎟️ Зовём на весенний Хабр Семинар 2026

Время говорить о том, как ИТ-бренд и внешние коммуникации работают на удержание сотрудников. Встречаемся 11 марта в Москве.

→ ваш билет здесь

Data Scientist в команду Horizontal ML NLP

Требования

Ученый по данным
Senior
Python
SQL

Условия

Можно удалённо
Москва

Компания

Международная технологическая компания, лидер рынков e‑commerce и наружной рекламы в России

Описание вакансии

О компании и команде

Wildberries – это крупнейший маркетплейс России с миллионами пользователей и миллиардами оборота, работающий на рынке уже 20 лет.

Наша компания стабильно развивается и работает в усиленном режиме: использует современный стек и новейшие технологии, разрабатывает множество новых hi-tech продуктов.

Мы ищем Middle+ / Senior Data Scientists в команду Horizontal ML NLP / Recsys. Основная задача - приносить пользу различным продуктам внутри WB. В моменте фокусируемся на кандидатных моделях для рекомендаций, спеллчеке, различных сценариях в поиске и многом другом.

Ожидания от кандидата

  • Понимание принципов работы архитектур нейронных сетей;
  • Уверенный опыт обучения и практического применения современных нейросетевых моделей NLP и рекомендаций на torch;
  • Понимание принципов работы LLM, LoRA;
  • Опыт работы с системами инференса моделей;
  • Опыт классичесого ML, иерархической кластеризации, мультикласс и мультилейбл классификации;
  • Знания фреймворков автоматизации разработки ML-моделей - Airflow/MLFlow;
  • Уверенное владение SQL-подобными базами данных, такими как Postgres, Clickhouse, Greenplum;
  • Наличие публикаций по нейросетевой тематике / опыт выступлений на конференциях / навыки работы с Hadoop, HDFS и Spark будут считаться плюсом.

Что нужно делать

  • Улучшать ранжирование товаров в поиске;
  • Разрабатывать персонализированные user2item и item2item модели рекомендаций;
  • Строить вопросно-ответные системы с помощью LLM;
  • Разрабатывать спеллчекер на основе нейросетей.

Условия работы

  • Интересные задачи, и исследовательские, и прикладные, возможность переключаться между ними и видеть улучшения от них в production;
  • Большие данные, сотни миллионов товаров, миллиарды действий пользователей в день, ресурсы и инфраструктуру, необходимые для работы с ними;
  • Инфраструктура: Мощные GPU-кластеры, петабайты данных;
  • Развитие: Конференции, курсы, внутренние митапы;
  • Гибридный или удаленный формат работы с гибким началом рабочего дня;
  • Бесплатное питание в наших офисах;
  • Скидки на фитнес и образовательные программы.