Data Engineer

Зарплата

от 150 000 ₽

Местоположение и тип занятости

МоскваПолный рабочий день

Компания

Одна из ключевых компаний российской финансовой инфраструктуры

Описание вакансии

Условия работы

Наша команда занимается реализацией ИТ-стратегии по работе с данными, разработкой и внедрением аналитических продуктов (в т.ч. с использованием ML), повышением эффективности процессов внутри организации. Мы стремимся обеспечить максимально простой и удобный доступ к данным для всех заинтересованных, организовать эффективное и надежное хранение информации путем реновации ИТ-инфраструктуры.

Обязанности:

  • Проведение аудита ИТ-инфраструктуры;
  • Настройка и поддержка ETL/ELT процессов;
  • Решение нестандартных задач (например, получение данных из прочих систем с учетом наличия жестких требований по соблюдению секретности данных);
  • Продумывание и реализация механизмов сбора и хранения данных (существующих и новых систем);
  • Предоставление экспертной поддержки ML-инженерам;
  • Проведение первичной установки и настройка программного обеспечения из области анализа данных в случае отсутствия экспертизы у администраторов;
  • Взаимодействовать с аналитиками и владельцами продуктов, создание и поддержка сопроводительной документации, развитие базы знаний;
  • Участие в разработке пайплайнов перелива и обработки данных;
  • Повышение доступности и эффективности данных;

Требования:

  • Высшее техническое образование;
  • Знание основных алгоритмов и структур данных;
  • Опыт организации и реорганизации структуры хранения и потоков данных в крупных организациях;
  • Опыт организации DWH/Data Lake;
  • Понимание принципов хранения информации в SQL и NoSQL, а также умение работать с реляционными и нереляционными базами данных (как минимум несколькими из MySQL, MSSQL, PostgreSQL, MongoDB, SQL Server, Oracle, HP Vertica, Amazon Redshift);
  • Опыт работы с ETL-системами (Airflow, Informatica ETL, Pentaho ETL, Talend и пр.);
  • Знакомство со стеком Apache Hadoop (HDFS, HBase, Cassandra) и SQL-движками для анализа данных, хранящихся в распределенных файловых системах типа HDFS (Apache Hive, Impala и пр.);
  • Опыт работы с Big Data на базе Apache (Hadoop, Kafka, Spark);
  • Знание языков программирования Python (предпочтительно), Java или Scala для работы с Big Data системами;
  • Опыт работы с Linux и Windows.

Условия:

  • Комфортный офис в центре – ст. м. Бауманская;
  • Возможность удаленной работы;
  • Конкурентную заработную плату;
  • Привлекательный социальный пакет с расширенной медицинской страховкой, годовым бонусом по итогам работы, корпоративной программой лояльности;
  • Корпоративный университет, изучение английского языка, электронная библиотека, профессиональные курсы и конференции;
  • Насыщенная корпоративная жизнь: тимбилдинги, корпоративные клубы, спортивные мероприятия (мини-футбол, баскетбол, волейбол, яхтенный клуб, клуб по триатлону).