Machine Learning Engineer

Зарплата

от 190 000 до 230 000 ₽

Требования

Бэкенд, Средний (Middle)JavaScalaApache HadoopApache SparkSQLETL

Местоположение и тип занятости

Санкт-ПетербургПолный рабочий день

Компания

Крупнейшая цифровая платформа. Технобренд, объединяющий лучшие мировые практики и самый современный стек

Описание вакансии

Условия работы

В дивизион Цифровой кредитный мониторинг Корпоративного блока ПАО Сбербанк ищем коллегу.

Вам предстоит работа в команде, где будут методологи, аналитики, разработчики, data scientist’ы и data engineer’ы.

Команда занимается исследованиями, разработкой и выводом в пром моделей для задач в области цифрового кредитного мониторинга.

Спектр и характер задач предполагает применение широкого инструментария ML, DL, статистики, в таких областях как: NPL, CV, анализ временных рядов.

Некоторые примеры применения моделей:

Наши модели работают на предсказание дефолтов, анализ текстов новостей, мониторинг объектов по космоснимкам, понимание и классификацию условий договора, идентификацию объектов недвижимости в текстах выписок из ЕГРН.

Функциональные обязанности:

  1. Проведение исследований и разработка моделей на этапе POC
  2. Разработка /подготовка pipeline предобработки данных для моделей, в том числе написание витрин данных на стеке Hadoop/Hive/Spark
  3. Адаптация кода моделей для вывода в production
  4. Подготовка автотестов.

Основные требования:

  • Опыт разработки на Python от 1 года.
  • Опыт или завершённые курсы DS и/или проекты/разработанные модели (примеры ноутбуков).
  • Отличное знание SQL - Join`ы, агрегаты, группировки, вложенные запросы, индексы, хранимые процедуры, оконные функции.
  • Знание форматов данных: сsv и разновидности, json, yaml, parquet, orc.
  • Знание OLTP, OLAP, ACID, Теорема CAP.
  • Понимание процессов ETL, ELT; CDC ​— как плюс.
  • Знание языков Scala или Java — как плюс.

Мы предлагаем:

  • Комфортный офис рядом с метро или удаленная работа из дома в пределах С-Пб и Лен области.
  • Отсутствие дресс-кода.
  • ДМС.
  • Крупнейшее DS&AI community - более 600 DS банка, включая:
  • Регулярный обмен знаниями, опытом и лучшими практиками.
  • Возможность переиспользования кода и библиотек из централизованного репозитория.
  • Интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний.
  • Дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира.
  • Регулярные внутренние митапы.