Team Lead Data scientist (Управление рисками корпоративных клиентов)
Требования
Местоположение и тип занятости
Компания
Описание вакансии
Условия работы
Мы — амбициозная и дружная команда, ежедневно исследующая данные корпоративных клиентов Сбербанка. Наши модели – двигатель не имеющих аналогов в России продуктов в сфере управления рисками корпоративных клиентов.
Сводная статистика о нас:
- Мы решаем задачи по 8 основным направлениям (от монументального ПВР до всеобъемлющих графов и молодого и амбициозного ESG);
- 95% наших моделей разрабатываются с применением облачных технологий;
- Мы придерживаемся единого стандарта работы, используем JIRA/Confluence/BitBucket, у нас есть единый бэклог;
- 25% нашей команды имеют западное образование и опыт работы в странах Европы;
- Мы сотрудничаем с передовыми ВУЗами в 3-ёх городах России;
- Просрочка по кредитному продукту на основе наших моделей стремится к 0.
В команде с заказчиками мы:
- Погружаемся в предметную область;
- Прорабатываем постановку задачи;
- Ищем и исследуем данные;
- Выбираем оптимальные методы моделирования;
- Разрабатываем и верифицируем модели;
- Готовим отчеты о разработке и презентуем результаты;
- Мониторим модели;
- Наслаждаемся результатом.
В рамках работы над задачей мы будем:
- Разрабатывать и улучшать инструменты для машинного обучения (внутренние наработки, библиотеки);
- Использовать прогнозное моделирование, чтобы оптимизировать бизнес риск метрики;
- Работать в команде с портфельными менеджерами, чтобы понять нужды бизнеса и предложить возможные решения;
- Разрабатывать модели машинного обучения;
- Разрабатывать архитектуру пилотов для тестирования гипотез;
- Прокачивать коллег и развиваться самим.
Качественные факторы кандидатов с высоким Feature important:
- Диплом в области компьютерных наук, статистики, прикладной математики или другой релевантной области;
- Опыт работы от 3х лет с одной или несколькими СУБД: Oracle, MS SQL, Teradata либо СУБД стэка Bigdata
- Опыт работы с хранилищами данных от 1го года
- Опыт работы в роли аналитика с функцией подготовки выгрузки данных для заказчика
- Сильные компетенции в области реляционных СУБД и хранилищ данных:
- Глубокое понимание статистических подходов и методов (регрессия, свойства распределений, оценка максимального правдоподобия, проверка гипотез и их правильное использование) и опыт их применения;
- Знания и опыт применения алгоритмов машинного обучения (GLM/Regression, Trees, Random Forest, Boosting), а также знание их преимуществ, недостатков и ограничений;
- Приветствуется знание принципов работы нейронных сетей и опыт использования библиотек для их обучения (Keras/PyTorch/TensorFlow);
- Знание Python и основных DS библиотек;
- Отличные знания английского языка (устный и письменный) как преимущество;
- Опыт в распределённых/параллельных вычислениях с помощью следующих технологий: Hadoop, Spark, Dask и другие как преимущество;
А ещё у нас есть:
Развитая IT архитектура. Мощный GPU кластер, возможность расчётов на суперкомпьютере top30 в мире;
Работа над передовыми задачами в банковском секторе;
Постоянное развитие: обучающие курсы от лучших университетов и компаний (МФТИ, ВШЭ, NVIDIA и другие), участие в международных конференциях;
Большую сильную команду;
Развитое DS community.