ETL разработчик/ Data engineer

Местоположение и тип занятости

МоскваПолный рабочий день

Компания

Крупнейшая цифровая платформа. Технобренд, объединяющий лучшие мировые практики и самый современный стек

Описание вакансии

Условия работы

В SberData мы создаем централизованное хранилище данных всего Сбера. Это более 350 источников данных и 100+ Пб информации, заказ и получение данных за 15 минут и современный технологический стек работы с данными, включая собственные сборки СУБД на базе Hadoop и Greenplum.
Наши решения отмечены международной премией Data Award в 2021г, а лидеры, обладающие уникальными знаниями в разработке кода и современном технологическом стеке С, Scala, Java, Python, Hadoop, Teradata, Oralce и др., являются участниками организации-фонда Apache Foundation. Масштаб задач, объемы данных, сложности финансовых процессов — мы все время на передовой современных технологий, а где-то и создаем их. Будем рады видеть в нашей команде системных разработчиков ClickHouse, DevOps-инженеров, системных администраторов, специалистов по разработке Scala/Java, разработчиков Python и специалистов других профилей.

Проект: Интеграция 2-х крупнейших платформ Банка: ППРБ (Платформа поддержки развития бизнеса) и КАП (Корпоративная аналитическая платформа). Реализация механизмов и автоматизация процессов поставки данных продуктовых систем Банка в Корпоративную аналитическую платформу на базе экосистемы Hadoop в near real time режиме.

Тебе предстоит:

  • участие в сложных интеграционных проектах по развитию гибридного DWH Сбербанка (Hadoop, Oracle, Kafka) в роли разработчика или лидера разработки;
  • разработка и проектирование потоков данных, алгоритмов загрузки и обработки данных в Hadoop;
  • оптимизация и настройка производительности ETL-процессов;
  • анализ и тестирование существующих решений в технологическом стеке Hadoop;
  • разработка конфигурации прикладной репликации данных;
  • оценка трудозатрат задач по проекту, планирование исполнения задач;
  • организация взаимодействия членов интеграционной команды;
  • участия в разработке и оптимизации процессов тиража.

Бонусы

  • конкурентная компенсация (оклад и премии по результатам деятельности);
  • ДМС, страхование жизни;
  • бесплатный фитнес-зал в БЦ;
  • льготные кредиты и корпоративные скидки;
  • карьерный рост в команде дружных профессионалов;
  • корпоративное обучение, семинары, тренинги, конференции, библиотека;
  • инновационные и амбициозные проекты и задачи;
  • свободный дресс-код.

Дополнительные инструкции

  • фундаментальные знания принципов построения распределенных систем хранения и обработки данных;
  • наличие опыта работы с экосистемой Hadoop (HDFS, Hive, Impala, HBase, Oozie, Yarn, Kafka) будет плюсом;
  • опыт работы с реляционными СУБД;
  • хорошее знание SQL, PL/SQL;
  • навыки работы с Unix shell, системами версионирования кода;
  • опыт работы с гибкими методологиями и инструментами разработки (Agile);
  • приветствуется опыт работы с промышленными ETL-инструментами;
  • приветствуется опыт программирования на Scala/Java;
  • опыт работы с инструментами компании Atlassian;
  • фундаментальные знания принципов работы RDBMS.