Data scientist
Требования
Местоположение и тип занятости
Компания
Описание вакансии
О компании и команде
R1 — это новый взгляд на пространство, в котором живет человек. Наша команда убеждена, что технологии способны сделать дом многофункциональным, удобным и универсальным как для семейных вечеров, так и для работы днем. Наша миссия — делать технологии понятными и доступными, чтобы каждый человек мог качественно улучшить свою жизнь, сделать собственный дом своим местом силы.
Мы запустили уникальный проект по рестарту функции клиентоцентричных продаж в базу и максимизации ценности клиента (CVM). Цель проекта - создание системы для предложения клиентам нужных продуктов в правильное время с удобным клиентским опытом.
В команду мы ищем Data Scientist’а с уклоном в MLOps для задач автоматизации ML пайплайнов. У нас много моделек, нужно дорабатывать и мониторить старые, параллельно внедряя новые.
На текущий момент стек: JupyterHub, Hadoop (PySpark, Hive), Airflow, Luigi, ClickHouse, Gitlab, но параллельно переходим на работу в облаке с использованием Kubeflow, MLflow, Feast и пр.
Ожидания от кандидата
Задачи:
- Разрабатывать ML-модели, описывающие поведение клиентов (Churn, Propensity to buy, СJ-логики, CLTV, Uplift-модели пр.), используя SOTA алгоритмы машинного обучения;
- Визуализировать и интерпретировать результаты разработанных моделей для принятия решений управленческой командой (SHAP, Feature Importance и др.);
- Проектировать, поддерживать и внедрять в промышленную эксплуатацию пайплайны по формированию признаков и обучению ML-моделей на различных фреймворках;
- Инферить LLM в бизнес процессы;
- Проходить полный цикл жизни ML модели: от формализации требования от бизнеса, сбора данных, прототипирования до дизайна пилотов и внедрения в продакшен;
Мы ожидаем:
- Опыт внедрения и автоматизации моделей в production. Работа с контейнерами (Docker, Kubernetes);
- Знание классического ML, мат статистики и теории вероятностей;
- Опыт в задачах классического скоринга (бинарные модели склонности к покупке, оттоку, метрики gini, Lift-кривая и пр.) или теоретическое понимание таких задач с желанием получить боевой опыт;
- Продвинутые знания Python и SQL (оконные функции и подзапросы):
- Опыт построения ML моделей (линейные модели, графовые модели, нейронные сети, ансамблевые алгоритмы);
- Опыт анализа ключевых показателей эффективности (AUC-ROC, R^2, Uplift@k и др.);
- Знание основных библиотек для анализа данных и машинного обучения (numpy, pandas, scikit-learn, pytorch, lightgbm, matplotlib);
- Опыт использования распределённых систем хранения и обработки данных (Hadoop, Spark, Spark Streaming) или желание быстро освоить;
- Опыт работы с системами контроля версий (Git / Bitbucket).
Будет плюсом:
- Опыт написания ML моделей для персонализации маркетинга, математической оптимизации (MILP) и понимание теории Uplift моделирования (X-learner, T-learner, Uplift деревья).
Условия работы
- Оформление по ТК РФ, полностью белая з/п;
- ДМС со стоматологией после испытательного срока, 100% компенсация больничного;
- Скидки от компаний-партнеров;
- Удаленка, гибрид или работа в офисе - на ваш выбор;
- Кроме того, R1 аккредитована как IT компания.