Middle / Senior Data Scientist в WB Space

Местоположение и тип занятости

МоскваПолный рабочий деньМожно удаленно

Компания

Международный интернет-магазин одежды, обуви и товаров для дома

Описание вакансии

О компании и команде

Мы ищем опытного Data Scientist в команду разработки WB Space — платформы для проведения ML-соревнований. 

В этой роли вы будете разрабатывать ML-проекты соревнований, лучшие решения которых смогут масштабироваться в продуктовые ML-модели и использоваться в реальных бизнес-процессах. Это позволит привлекать сильных специалистов и напрямую влиять на ключевые бизнес-показатели компании.

Ожидания от кандидата

  • Глубокие знания алгоритмов и структур данных;
  • Уверенное владение Python (NumPy, Pandas, Scikit-learn, PyTorch/TensorFlow);
  • Сильный математический бэкграунд в линейной алгебре, вероятности и статистике;
  • Глубокое понимание классического машинного обучения и основ Deep Learning;
  • Опыт обучения и дообучения нейросетей на PyTorch;
  • Практический опыт работы с задачами NLP, Time Series, CV, RecSys (от 2 лет);
  • Опыт контейнеризации и работы с Docker;
  • Навыки инференса моделей, разработки и деплоя ML-сервисов;
  • Опыт преподавания или ведения образовательной практики в области машинного обучения и опыт выкатки моделей в production будут плюсом.

Что нужно делать

  • Разрабатывать ML-задачи для соревнований, учитывая бизнес-потребности;
  • Подбирать и разрабатывать метрики оценки для ML-соревнований;
  • Консультировать заказчиков по постановке задач и выбору метрик;
  • Создавать baseline-решения и анализировать данные, применяя подходящие алгоритмы ML;
  • Визуализировать результаты и представлять их команде;
  • Формировать задачи, конечным решением которых будет Docker-образ;
  • Поддерживать участников на всех этапах соревнований;
  • Взаимодействовать с вузами, курировать студенческие проекты и образовательные инициативы.

Условия работы

  • Интересные задачи, и исследовательские, и прикладные, возможность переключаться между ними и видеть улучшения от них в production;
  • Большие данные, сотни миллионов товаров, миллиарды действий пользователей в день, ресурсы и инфраструктуру, необходимые для работы с ними;
  • Инфраструктура: Мощные GPU-кластеры, петабайты данных;
  • Развитие: Конференции, курсы, внутренние митапы;
  • Гибридный или удаленный формат работы с гибким началом рабочего дня;
  • Бесплатное питание в наших офисах;
  • Скидки на фитнес и образовательные программы.