Data scientist

19 сентября

Требования

Ученый по данным, Средний (Middle) • Python • SQL

Местоположение и тип занятости

• Можно удаленно

Компания

R-One

Мы создаем новый опыт взаимодействия с цифровыми продуктами для дома — удобный, простой и понятный.

Описание вакансии

О компании и команде

R1 — это новый взгляд на пространство, в котором живет человек. Наша команда убеждена, что технологии способны сделать дом многофункциональным, удобным и универсальным как для семейных вечеров, так и для работы днем. Наша миссия — делать технологии понятными и доступными, чтобы каждый человек мог качественно улучшить свою жизнь, сделать собственный дом своим местом силы.

Мы запустили уникальный проект по рестарту функции клиентоцентричных продаж в базу и максимизации ценности клиента (CVM). Цель проекта - создание системы для предложения клиентам нужных продуктов в правильное время с удобным клиентским опытом.

В команду мы ищем Data Scientist’а с уклоном в MLOps для задач автоматизации ML пайплайнов. У нас много моделек, нужно дорабатывать и мониторить старые, параллельно внедряя новые.

На текущий момент стек: JupyterHub, Hadoop (PySpark, Hive), Airflow, Luigi, ClickHouse, Gitlab, но параллельно переходим на работу в облаке с использованием Kubeflow, MLflow, Feast и пр.

Ожидания от кандидата

Задачи:

Разрабатывать ML-модели, описывающие поведение клиентов (Churn, Propensity to buy, СJ-логики, CLTV, Uplift-модели пр.), используя SOTA алгоритмы машинного обучения;
Визуализировать и интерпретировать результаты разработанных моделей для принятия решений управленческой командой (SHAP, Feature Importance и др.);
Проектировать, поддерживать и внедрять в промышленную эксплуатацию пайплайны по формированию признаков и обучению ML-моделей на различных фреймворках;
Инферить LLM в бизнес процессы;
Проходить полный цикл жизни ML модели: от формализации требования от бизнеса, сбора данных, прототипирования до дизайна пилотов и внедрения в продакшен;

Мы ожидаем:

Опыт внедрения и автоматизации моделей в production. Работа с контейнерами (Docker, Kubernetes);
Знание классического ML, мат статистики и теории вероятностей;
Опыт в задачах классического скоринга (бинарные модели склонности к покупке, оттоку, метрики gini, Lift-кривая и пр.) или теоретическое понимание таких задач с желанием получить боевой опыт;
Продвинутые знания Python и SQL (оконные функции и подзапросы):
Опыт построения ML моделей (линейные модели, графовые модели, нейронные сети, ансамблевые алгоритмы);
Опыт анализа ключевых показателей эффективности (AUC-ROC, R^2, Uplift@k и др.);
Знание основных библиотек для анализа данных и машинного обучения (numpy, pandas, scikit-learn, pytorch, lightgbm, matplotlib);
Опыт использования распределённых систем хранения и обработки данных (Hadoop, Spark, Spark Streaming) или желание быстро освоить;
Опыт работы с системами контроля версий (Git / Bitbucket).

Будет плюсом:

Опыт написания ML моделей для персонализации маркетинга, математической оптимизации (MILP) и понимание теории Uplift моделирования (X-learner, T-learner, Uplift деревья).

Условия работы

Оформление по ТК РФ, полностью белая з/п;
ДМС со стоматологией после испытательного срока, 100% компенсация больничного;
Скидки от компаний-партнеров;
Удаленка, гибрид или работа в офисе - на ваш выбор;
Кроме того, R1 аккредитована как IT компания.

Смотреть ещё вакансии

Data Scientist

Data Scientist удаленно