📢 Занимаетесь брендом работодателя?

Приходите 11 марта на Хабр Семинар, поговорим о том, как бренд и коммуникации становятся частью стратегии удержания.

→ Узнать больше

Team Lead Data scientist (Управление рисками корпоративных клиентов)

Требования

Ученый по данным
Senior
Python
Датамайнинг
Deep Learning
Математическое моделирование
Машинное обучение

Условия

Москва

Компания

Крупнейшая цифровая платформа. Технобренд, объединяющий лучшие мировые практики и самый современный стек

Описание вакансии

Мы — амбициозная и дружная команда, ежедневно исследующая данные корпоративных клиентов Сбербанка. Наши модели – двигатель не имеющих аналогов в России продуктов в сфере управления рисками корпоративных клиентов.

Сводная статистика о нас:

  • Мы решаем задачи по 8 основным направлениям (от монументального ПВР до всеобъемлющих графов и молодого и амбициозного ESG);
  • 95% наших моделей разрабатываются с применением облачных технологий;
  • Мы придерживаемся единого стандарта работы, используем JIRA/Confluence/BitBucket, у нас есть единый бэклог;
  • 25% нашей команды имеют западное образование и опыт работы в странах Европы;
  • Мы сотрудничаем с передовыми ВУЗами в 3-ёх городах России;
  • Просрочка по кредитному продукту на основе наших моделей стремится к 0.

В команде с заказчиками мы:

  • Погружаемся в предметную область;
  • Прорабатываем постановку задачи;
  • Ищем и исследуем данные;
  • Выбираем оптимальные методы моделирования;
  • Разрабатываем и верифицируем модели;
  • Готовим отчеты о разработке и презентуем результаты;
  • Мониторим модели;
  • Наслаждаемся результатом.

В рамках работы над задачей мы будем:

  • Разрабатывать и улучшать инструменты для машинного обучения (внутренние наработки, библиотеки);
  • Использовать прогнозное моделирование, чтобы оптимизировать бизнес риск метрики;
  • Работать в команде с портфельными менеджерами, чтобы понять нужды бизнеса и предложить возможные решения;
  • Разрабатывать модели машинного обучения;
  • Разрабатывать архитектуру пилотов для тестирования гипотез;
  • Прокачивать коллег и развиваться самим.

Качественные факторы кандидатов с высоким Feature important:

  • Диплом в области компьютерных наук, статистики, прикладной математики или другой релевантной области;
  • Опыт работы от 3х лет с одной или несколькими СУБД: Oracle, MS SQL, Teradata либо СУБД стэка Bigdata
  • Опыт работы с хранилищами данных от 1го года
  • Опыт работы в роли аналитика с функцией подготовки выгрузки данных для заказчика
  • Сильные компетенции в области реляционных СУБД и хранилищ данных:
  • Глубокое понимание статистических подходов и методов (регрессия, свойства распределений, оценка максимального правдоподобия, проверка гипотез и их правильное использование) и опыт их применения;
  • Знания и опыт применения алгоритмов машинного обучения (GLM/Regression, Trees, Random Forest, Boosting), а также знание их преимуществ, недостатков и ограничений;
  • Приветствуется знание принципов работы нейронных сетей и опыт использования библиотек для их обучения (Keras/PyTorch/TensorFlow);
  • Знание Python и основных DS библиотек;
  • Отличные знания английского языка (устный и письменный) как преимущество;
  • Опыт в распределённых/параллельных вычислениях с помощью следующих технологий: Hadoop, Spark, Dask и другие как преимущество;

А ещё у нас есть:

Развитая IT архитектура. Мощный GPU кластер, возможность расчётов на суперкомпьютере top30 в мире;

Работа над передовыми задачами в банковском секторе;

Постоянное развитие: обучающие курсы от лучших университетов и компаний (МФТИ, ВШЭ, NVIDIA и другие), участие в международных конференциях;

Большую сильную команду;

Развитое DS community.