Middle Data Scientist (Цифровой кредитный мониторинг)

Местоположение и тип занятости

МоскваПолный рабочий день

Компания

Крупнейшая цифровая платформа. Технобренд, объединяющий лучшие мировые практики и самый современный стек

Описание вакансии

Условия работы

В дивизион Цифровой кредитный мониторинг Корпоративного блока ПАО Сбербанк требуются Data Scientistы и Data Engeneerы.
Предстоит работа в команде, где будут методологи, аналитики, разработчики и другие DS и DE.
Команда занимается анализом транзакционных данных, финансовых и разнообразных внешних данных. Есть возможность заниматься задачами по анализу тестов.



У Сбербанка есть ряд особенностей:

  • Возможность поработать с действительно богатыми и интересными данными (у нас очень много клиентов по всей России).
  • Возможность быть частью быстрорастущего DS сообщества Сбербанка.
  • Возможность писать на современном стеке (Python + Spark) и проникнуться всеми нюансами работы в большой технологической компании.


Предстоят следующие задачи:

  • Построение различных дескриптивных моделей
  • Построение ранжирующих моделей по клиентам
  • Прогнозирование событий во время всего жизненного цикла клиентов в банке
  • Прогнозирование временных рядов


Обязанности:

  • Участие в постановке задачи и ее бизнес применения
  • Построение, разработка и поддержка моделей машинного обучения (Python + Spark и тд)
  • Построение аналитических отчетов по результатам проведенной работы
  • Обеспечение четкого и подробного документирования результатов моделирования для передачи на автоматизацию


Работа с данными:

  • Знание SQL - простые запросы, Join`ы, агрегаты, группировки, вложенные запросы
  • Знание python: стандартные структуры данных (dict, list, set, модуль collections), pandas, numpy, h5py;
  • Знакомство с форматами данных: сsv и разновидности, json, yaml, parquet, orc;
  • Опыт работы с Hadoop (Hive, Spark, HBase) является плюсом

Моделирование:

  • Feature Enginering: - методы оценки значимости и отбора признаков, методы уменьшения размерности, приемы работы с текстом;
  • Model - различать основные классы задач (регрессия, классификация, кластеризация) и уметь формулировать бизнес-задачу в их терминах. Знать основные методы и знать api по их использованию; Знать методы работы с временными рядами;
  • Python - sklearn, numpy, scipy, xgboost

Что мы готовы предложить Вам:

  • современный Agile-офис, Кутузовский 32: парковка, спортзал, зоны отдыха, приятная атмосфера
  • ДМС
  • крупнейшее DS&AI community - более 600 DS банка
  • регулярный обмен знаниями, опытом и лучшими практиками
  • возможность переиспользования кода и библиотек из централизованного репозитория
  • интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний
  • дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
  • регулярные внутренние митапы
  • доход оклад + годовая премия, обсуждается индивидуально;