Team Lead Data scientist (Управление рисками корпоративных клиентов)

16 сентября 2022

Требования

Ученый по данным, Старший (Senior) • Python • Датамайнинг • Deep Learning • Математическое моделирование • Машинное обучение

Местоположение и тип занятости

Москва • Полный рабочий день

Компания

Сбер

Крупнейшая цифровая платформа. Технобренд, объединяющий лучшие мировые практики и самый современный стек

Описание вакансии

Условия работы

Мы — амбициозная и дружная команда, ежедневно исследующая данные корпоративных клиентов Сбербанка. Наши модели – двигатель не имеющих аналогов в России продуктов в сфере управления рисками корпоративных клиентов.

Сводная статистика о нас:

Мы решаем задачи по 8 основным направлениям (от монументального ПВР до всеобъемлющих графов и молодого и амбициозного ESG);
95% наших моделей разрабатываются с применением облачных технологий;
Мы придерживаемся единого стандарта работы, используем JIRA/Confluence/BitBucket, у нас есть единый бэклог;
25% нашей команды имеют западное образование и опыт работы в странах Европы;
Мы сотрудничаем с передовыми ВУЗами в 3-ёх городах России;
Просрочка по кредитному продукту на основе наших моделей стремится к 0.

В команде с заказчиками мы:

Погружаемся в предметную область;
Прорабатываем постановку задачи;
Ищем и исследуем данные;
Выбираем оптимальные методы моделирования;
Разрабатываем и верифицируем модели;
Готовим отчеты о разработке и презентуем результаты;
Мониторим модели;
Наслаждаемся результатом.

В рамках работы над задачей мы будем:

Разрабатывать и улучшать инструменты для машинного обучения (внутренние наработки, библиотеки);
Использовать прогнозное моделирование, чтобы оптимизировать бизнес риск метрики;
Работать в команде с портфельными менеджерами, чтобы понять нужды бизнеса и предложить возможные решения;
Разрабатывать модели машинного обучения;
Разрабатывать архитектуру пилотов для тестирования гипотез;
Прокачивать коллег и развиваться самим.

Качественные факторы кандидатов с высоким Feature important:

Диплом в области компьютерных наук, статистики, прикладной математики или другой релевантной области;
Опыт работы от 3х лет с одной или несколькими СУБД: Oracle, MS SQL, Teradata либо СУБД стэка Bigdata
Опыт работы с хранилищами данных от 1го года
Опыт работы в роли аналитика с функцией подготовки выгрузки данных для заказчика
Сильные компетенции в области реляционных СУБД и хранилищ данных:
Глубокое понимание статистических подходов и методов (регрессия, свойства распределений, оценка максимального правдоподобия, проверка гипотез и их правильное использование) и опыт их применения;
Знания и опыт применения алгоритмов машинного обучения (GLM/Regression, Trees, Random Forest, Boosting), а также знание их преимуществ, недостатков и ограничений;
Приветствуется знание принципов работы нейронных сетей и опыт использования библиотек для их обучения (Keras/PyTorch/TensorFlow);
Знание Python и основных DS библиотек;
Отличные знания английского языка (устный и письменный) как преимущество;
Опыт в распределённых/параллельных вычислениях с помощью следующих технологий: Hadoop, Spark, Dask и другие как преимущество;

А ещё у нас есть:

Развитая IT архитектура. Мощный GPU кластер, возможность расчётов на суперкомпьютере top30 в мире;

Работа над передовыми задачами в банковском секторе;

Постоянное развитие: обучающие курсы от лучших университетов и компаний (МФТИ, ВШЭ, NVIDIA и другие), участие в международных конференциях;

Большую сильную команду;

Развитое DS community.