👀 Признавайтесь, бросали курсы когда-то? Расскажите нам, не держите это в себе → погнали!

Middle/Senior Data Scientist

Местоположение и тип занятости

Полный рабочий деньМожно удаленно

Компания

Международный интернет-магазин одежды, обуви и товаров для дома

Описание вакансии

О компании и команде

Wildberries – это не только 9 миллионов заказов и 1 миллиард поисковых запросов в день, но и команда, которая стремится быть на переднем крае технологий и инноваций. Мы используем SOTA-решения в production и постоянно развиваем нашу A/B платформу, поисковой движок и другие проекты.

Мы ищем опытного Data Scientist в команду разработки платформы WB Space для проведения ML-соревнований. Это возможность напрямую влиять на продукты и GMV компании, привлекая талантливых специалистов. Дополнительно предстоит работа с ТОП-ВУЗами: ведение практики, подготовка заданий для проектов студентов и техношколы по ML-направлениям.

Наш стек: Python, Go, Mlflow, ClearML, Prometeus, Grafana, Docker, PyTorch, Airflow, Postgres, Clickhouse, K8s, FastAPI, Gitlab, PyTorch, Tensorflow, ONNX

Чем предстоит заниматься:

  • Анализировать текущие решения в компании для формирования новых задач;
  • Подбирать, разрабатывать новые метрики для ML-соревнований с учетом бизнес-задач;
  • Консультировать заказчиков по постановке задачи и формированию метрик для ML-соревнований на платформе;
  • Разрабатывать baseline-решения для различных задач в рамках соревнований;
  • Визуализировать данные и представлять результаты;
  • Формировать задачи для ML-соревнований, где конечным решением будет Docker-образ;
  • Вести практику и подготовку заданий для проектов студентов в топовых ВУЗах;
  • Готовить и помогать коллегам реализовывать задания для техношколы по разным ML-направлениям.

Ожидания от кандидата

Что мы ожидаем:

  • Знание алгоритмов и структур данные
  • Уверенные знания Python
  • Уверенные знания математики для ML
  • Уверенные и глубокие знания классического машинного обучения
  • Уверенные и глубокие знания основ Deep Learning
  • Обучение и дообучение нейросетей на PyTorch
  • Опыт работы с разными типами задач NLP/Time Series/CV/RecSys от 2х лет
  • Опыт работы с Docker-образами
  • Умение делать inference для моделей, проектировать, разрабатывать и разворачивать собственные сервисы

Будет плюсом:

  • Опыт преподавания или ведения практики для студентов в области машинного обучения
  • Опыт выкатки моделей в production
  • Опыт работы с большими данными, применения распределённых вычислений
  • Опыт работы с Gitlab
  • Опыт решения задач Classification, Object Detection, Segmentation, Anomaly Detection, OCR

Условия работы

  • Гибкое начало рабочего дня и гибридный формат работы: 5 офисов в Москве (с бесплатными завтраками, обедами и ужинами);
  • Вариативность оформления: трудовой договор, самозанятость, ИП или ГПХ;
  • Корпоративные скидки у партнеров, внешние программы по обучению и внутренние митапы;
  • Ежегодная 40%-ая скидка на покупку ноутбука или мобильного телефона.