Data Scientist

Местоположение и тип занятости

Полный рабочий деньМожно удаленно

Описание вакансии

Условия работы

Мы data-driven компания, принимаем бизнес-решения на основе данных.

Дирекция Data & Analytics участвует во всех ключевых бизнес-процессах компании. Мы ищем тех, кто вместе с нами будет поддерживать и развивать централизованное хранилище данных, создавать инструменты для анализа, проводить исследования, создавать продукты на основе данных, улучшать клиентский опыт Lamoda и основные метрики компании, извлекать и монетизировать большие данные.

О команде и продукте

В дирекции Data & Analytics в отделе Data Science открыты позиции в 2 направлениях:

1) Команда прайсинга: разрабатываем систему динамического ценообразования: строим модели прогнозирования продаж и решаем сложные оптимизационные задачи по подбору оптимального набора цен.

2) Команда поиска, навигации: улучшаем качество поисковой выдачи за счет доработки поисковых алгоритмов (NER, исправление опечаток), обогащаем текстовые описания товаров, улучшаем инструменты навигации.

Используемый стэк технологий: Big data (Hadoop, PySpark, Hive), Python, Catboost, Airflow, Docker, SQL, PyTorch.

Почему у нас классно:

  • Хорошо выстроенные процессы: квартальное планирование по методологии OKR, двухнедельные спринты, регулярные стендапы и проектные встречи для синхронизации.
  • Сильная команда middle и senior специалистов, развитое DS-сообщество, где есть возможность обмениваться знаниями на внутренних митапах
  • У нас представлен полный жизненный цикл разработки data-driven продуктов с применением ML — от идеи и генерации гипотез до запуска АБ тестов. В части разработки онлайн-сервисов и деплоя моделей нам помогает команда инженеров.

Чем вам предстоит заниматься:

  • Искать инсайты в данных и определять точки роста продукта;
  • Разрабатывать и проверять продуктовые гипотезы;
  • Работать в тесном сотрудничестве с разработчиками для вывода моделей в продакшн.

Мы ожидаем:

  • Опыт в области анализа данных и машинного обучения (от 2 лет);
  • Опыт работы с SQL, Hadoop, Hive, Spark;
  • Владение Python, Linux, методами работы с большими данными;
  • Опыт работы как минимум с 2 ML библиотеками: Scikit-learn, Vowpal Wabbit, XGBoost, Cat Boost, TensorFlow, Spark ML;
  • Знания теории вероятностей и математической статистики;
  • Знания в области машинного обучения, прогнозного моделирования и методов статистического анализа;
  • Знание алгоритмов и структур данных;
  • Высшее образование в области прикладной математики, информационных технологий, информатики и т.п;
  • Английский язык на уровне технического чтения и профессионального общения.

Будет плюсом:

  • Deep learning для компьютерного зрения или NLP.

Как мы работаем:

  • Пишем на Python 3.6+ и PySpark 3.0;
  • Для ресерча доступны два сервера (80 cores, 650Gb RAM), на которых развернут JupyrerHub и есть доступ к Hadoop-кластеру;
  • Код с логикой ML-пайплайнов упаковываем в Docker и выкатываем, используя CI/CD-инструменты с запуском code style проверок и тестов;
  • Используем Airflow для управления ML-пайплайнами и запуском их по расписанию;
  • В командах есть культура code review как для изменений по части продакшен-пайплайнов, так и для ресерч-задач;
  • Регулярно проводим командные брейнштормы с целью генерации новых идей по развитию наших data-driven продуктов;
  • В компании внедрена культура принятия решений на основании данных и все изменения тестируем через АБ-эксперименты.

Бонусы

  • Гибкий график работы, можно удобно планировать рабочее и личное время, а также работать удаленно;
  • Расширенную ДМС программу со стоматологией с первого месяца;
  • Скидки на весь каталог сайта Lamoda до 40%;
  • Единоразовая выплата в 15 тыс. рублей gross, которая идет в качестве частичной компенсации за обустройство рабочего места;
  • Обмен знаниями внутри компании - мы организуем внутренние митапы и являемся площадкой для различных профессиональных сообществ;
  • Английский язык: тем, кто регулярно использует его для работы, оплачиваем занятия полностью, остальным — щедрая скидка на языковые курсы SkyEng, Skillbox;
  • Возможность посещать конференции в качестве слушателей и докладчиков (для желающих подготовиться к выступлениям с докладами или презентациями у нас есть Speakers Club);
  • Вовлеченный в процессы менеджмент: наше руководство понимает и учитывает все особенности IT-разработки и готово услышать ваши крутые идеи;
  • Уютный офис в Москве (МЦК Хорошёво/м. Полежаевская) с настольным теннисом, кикером, тренажерным залом и йогой, а также коворкинг в центре Санкт-Петербурга.