Data Engineer

27 января 2021

Зарплата

от 150 000 ₽

Требования

Разработка ПО, Средний (Middle) • SQL • Python

Местоположение и тип занятости

Москва • Полный рабочий день

Компания

Национальный расчетный депозитарий

Одна из ключевых компаний российской финансовой инфраструктуры

Описание вакансии

Условия работы

Наша команда занимается реализацией ИТ-стратегии по работе с данными, разработкой и внедрением аналитических продуктов (в т.ч. с использованием ML), повышением эффективности процессов внутри организации. Мы стремимся обеспечить максимально простой и удобный доступ к данным для всех заинтересованных, организовать эффективное и надежное хранение информации путем реновации ИТ-инфраструктуры.

Обязанности:

Проведение аудита ИТ-инфраструктуры;
Настройка и поддержка ETL/ELT процессов;
Решение нестандартных задач (например, получение данных из прочих систем с учетом наличия жестких требований по соблюдению секретности данных);
Продумывание и реализация механизмов сбора и хранения данных (существующих и новых систем);
Предоставление экспертной поддержки ML-инженерам;
Проведение первичной установки и настройка программного обеспечения из области анализа данных в случае отсутствия экспертизы у администраторов;
Взаимодействовать с аналитиками и владельцами продуктов, создание и поддержка сопроводительной документации, развитие базы знаний;
Участие в разработке пайплайнов перелива и обработки данных;
Повышение доступности и эффективности данных;

Требования:

Высшее техническое образование;
Знание основных алгоритмов и структур данных;
Опыт организации и реорганизации структуры хранения и потоков данных в крупных организациях;
Опыт организации DWH/Data Lake;
Понимание принципов хранения информации в SQL и NoSQL, а также умение работать с реляционными и нереляционными базами данных (как минимум несколькими из MySQL, MSSQL, PostgreSQL, MongoDB, SQL Server, Oracle, HP Vertica, Amazon Redshift);
Опыт работы с ETL-системами (Airflow, Informatica ETL, Pentaho ETL, Talend и пр.);
Знакомство со стеком Apache Hadoop (HDFS, HBase, Cassandra) и SQL-движками для анализа данных, хранящихся в распределенных файловых системах типа HDFS (Apache Hive, Impala и пр.);
Опыт работы с Big Data на базе Apache (Hadoop, Kafka, Spark);
Знание языков программирования Python (предпочтительно), Java или Scala для работы с Big Data системами;
Опыт работы с Linux и Windows.

Условия:

Комфортный офис в центре – ст. м. Бауманская;
Возможность удаленной работы;
Конкурентную заработную плату;
Привлекательный социальный пакет с расширенной медицинской страховкой, годовым бонусом по итогам работы, корпоративной программой лояльности;
Корпоративный университет, изучение английского языка, электронная библиотека, профессиональные курсы и конференции;
Насыщенная корпоративная жизнь: тимбилдинги, корпоративные клубы, спортивные мероприятия (мини-футбол, баскетбол, волейбол, яхтенный клуб, клуб по триатлону).