Data scientist (Управление рисками корпоративных клиентов)

Местоположение и тип занятости

МоскваПолный рабочий день

Компания

Крупнейшая цифровая платформа. Технобренд, объединяющий лучшие мировые практики и самый современный стек

Описание вакансии

Условия работы

Мы — амбициозная и дружная команда, ежедневно исследующая данные корпоративных клиентов Сбербанка. Наши модели – двигатель не имеющих аналогов в России продуктов в сфере управления рисками корпоративных клиентов.

Сводная статистика о нас:

Мы решаем задачи по 8 основным направлениям (от монументального ПВР до всеобъемлющих графов и молодого и амбициозного ESG);

95% наших моделей разрабатываются с применением облачных технологий;

Мы придерживаемся единого стандарта работы, используем JIRA/Confluence/BitBucket, у нас есть единый бэклог;

25% нашей команды имеют западное образование и опыт работы в странах Европы;

Мы сотрудничаем с передовыми ВУЗами в 3-ёх городах России;

Просрочка по кредитному продукту на основе наших моделей стремится к 0.

Ранее мы воплотили в жизнь: https://tass.ru/ekonomika/6515798 https://www.banki.ru/news/lenta/?id=9924792

В команде с заказчиками мы:

Погружаемся в предметную область;

Прорабатываем постановку задачи;

Ищем и исследуем данные;

Выбираем оптимальные методы моделирования;

Разрабатываем и верифицируем модели;

Готовим отчеты о разработке и презентуем результаты;

Мониторим модели;

Наслаждаемся результатом.

В рамках работы над задачей мы будем:

Разрабатывать и улучшать инструменты для машинного обучения (внутренние наработки, библиотеки);

Использовать прогнозное моделирование, чтобы оптимизировать бизнес риск метрики;

Работать в команде с портфельными менеджерами, чтобы понять нужды бизнеса и предложить возможные решения;

Разрабатывать модели машинного обучения;

Разрабатывать архитектуру пилотов для тестирования гипотез;

Прокачивать коллег и развиваться самим.

Качественные факторы кандидатов с высоким Feature important:

Диплом в области компьютерных наук, статистики, прикладной математики или другой релевантной области;

Опыт работы от 3х лет с одной или несколькими СУБД: Oracle, MS SQL, Teradata либо СУБД стэка Bigdata

Опыт работы с хранилищами данных от 1го года

Опыт работы в роли аналитика с функцией подготовки выгрузки данных для заказчика

Сильные компетенции в области реляционных СУБД и хранилищ данных:

Глубокое понимание статистических подходов и методов (регрессия, свойства распределений, оценка максимального правдоподобия, проверка гипотез и их правильное использование) и опыт их применения;

Знания и опыт применения алгоритмов машинного обучения (GLM/Regression, Trees, Random Forest, Boosting), а также знание их преимуществ, недостатков и ограничений;

Приветствуется знание принципов работы нейронных сетей и опыт использования библиотек для их обучения (Keras/PyTorch/TensorFlow);

Знание Python и основных DS библиотек;

Отличные знания английского языка (устный и письменный) как преимущество;

Опыт в распределённых/параллельных вычислениях с помощью следующих технологий: Hadoop, Spark, Dask и другие как преимущество;

А ещё у нас есть:

Развитая IT архитектура. Мощный GPU кластер, возможность расчётов на суперкомпьютере top30 в мире;

Работа над передовыми задачами в банковском секторе;

Постоянное развитие: обучающие курсы от лучших университетов и компаний (МФТИ, ВШЭ, NVIDIA и другие), участие в международных конференциях;

Большую сильную команду;

Развитое DS community.