⭐️ Бэкендеры, с какой командой у вас мэтч? Проверяйте на Вайб-чеке → vibe.habr.com

Data scientist

Местоположение и тип занятости

Можно удаленно

Компания

Мы создаем новый опыт взаимодействия с цифровыми продуктами для дома — удобный, простой и понятный.

Описание вакансии

О компании и команде

R1 — это новый взгляд на пространство, в котором живет человек. Наша команда убеждена, что технологии способны сделать дом многофункциональным, удобным и универсальным как для семейных вечеров, так и для работы днем. Наша миссия — делать технологии понятными и доступными, чтобы каждый человек мог качественно улучшить свою жизнь, сделать собственный дом своим местом силы.

Мы запустили уникальный проект по рестарту функции клиентоцентричных продаж в базу и максимизации ценности клиента (CVM). Цель проекта - создание системы для предложения клиентам нужных продуктов в правильное время с удобным клиентским опытом.

В команду мы ищем Data Scientist’а с уклоном в MLOps для задач автоматизации ML пайплайнов. У нас много моделек, нужно дорабатывать и мониторить старые, параллельно внедряя новые.

На текущий момент стек: JupyterHub, Hadoop (PySpark, Hive), Airflow, Luigi, ClickHouse, Gitlab, но параллельно переходим на работу в облаке с использованием Kubeflow, MLflow, Feast и пр.

Ожидания от кандидата

Задачи:

  • Разрабатывать ML-модели, описывающие поведение клиентов (Churn, Propensity to buy, СJ-логики, CLTV, Uplift-модели пр.), используя SOTA алгоритмы машинного обучения;
  • Визуализировать и интерпретировать результаты разработанных моделей для принятия решений управленческой командой (SHAP, Feature Importance и др.);
  • Проектировать, поддерживать и внедрять в промышленную эксплуатацию пайплайны по формированию признаков и обучению ML-моделей на различных фреймворках;
  • Инферить LLM в бизнес процессы;
  • Проходить полный цикл жизни ML модели: от формализации требования от бизнеса, сбора данных, прототипирования до дизайна пилотов и внедрения в продакшен;

Мы ожидаем:

  • Опыт внедрения и автоматизации моделей в production. Работа с контейнерами (Docker, Kubernetes);
  • Знание классического ML, мат статистики и теории вероятностей;
  • Опыт в задачах классического скоринга (бинарные модели склонности к покупке, оттоку, метрики gini, Lift-кривая и пр.) или теоретическое понимание таких задач с желанием получить боевой опыт;
  • Продвинутые знания Python и SQL (оконные функции и подзапросы):
  • Опыт построения ML моделей (линейные модели, графовые модели, нейронные сети, ансамблевые алгоритмы);
  • Опыт анализа ключевых показателей эффективности (AUC-ROC, R^2, Uplift@k и др.);
  • Знание основных библиотек для анализа данных и машинного обучения (numpy, pandas, scikit-learn, pytorch, lightgbm, matplotlib);
  • Опыт использования распределённых систем хранения и обработки данных (Hadoop, Spark, Spark Streaming) или желание быстро освоить;
  • Опыт работы с системами контроля версий (Git / Bitbucket).

Будет плюсом:

  • Опыт написания ML моделей для персонализации маркетинга, математической оптимизации (MILP) и понимание теории Uplift моделирования (X-learner, T-learner, Uplift деревья).

Условия работы

  • Оформление по ТК РФ, полностью белая з/п;
  • ДМС со стоматологией после испытательного срока, 100% компенсация больничного;
  • Скидки от компаний-партнеров;
  • Удаленка, гибрид или работа в офисе - на ваш выбор;
  • Кроме того, R1 аккредитована как IT компания.

Смотреть ещё вакансии