Data Engineer
Зарплата
от 150 000 ₽
Требования
Местоположение и тип занятости
Компания
Одна из ключевых компаний российской финансовой инфраструктуры
Описание вакансии
Условия работы
Наша команда занимается реализацией ИТ-стратегии по работе с данными, разработкой и внедрением аналитических продуктов (в т.ч. с использованием ML), повышением эффективности процессов внутри организации. Мы стремимся обеспечить максимально простой и удобный доступ к данным для всех заинтересованных, организовать эффективное и надежное хранение информации путем реновации ИТ-инфраструктуры.
Обязанности:
- Проведение аудита ИТ-инфраструктуры;
- Настройка и поддержка ETL/ELT процессов;
- Решение нестандартных задач (например, получение данных из прочих систем с учетом наличия жестких требований по соблюдению секретности данных);
- Продумывание и реализация механизмов сбора и хранения данных (существующих и новых систем);
- Предоставление экспертной поддержки ML-инженерам;
- Проведение первичной установки и настройка программного обеспечения из области анализа данных в случае отсутствия экспертизы у администраторов;
- Взаимодействовать с аналитиками и владельцами продуктов, создание и поддержка сопроводительной документации, развитие базы знаний;
- Участие в разработке пайплайнов перелива и обработки данных;
- Повышение доступности и эффективности данных;
Требования:
- Высшее техническое образование;
- Знание основных алгоритмов и структур данных;
- Опыт организации и реорганизации структуры хранения и потоков данных в крупных организациях;
- Опыт организации DWH/Data Lake;
- Понимание принципов хранения информации в SQL и NoSQL, а также умение работать с реляционными и нереляционными базами данных (как минимум несколькими из MySQL, MSSQL, PostgreSQL, MongoDB, SQL Server, Oracle, HP Vertica, Amazon Redshift);
- Опыт работы с ETL-системами (Airflow, Informatica ETL, Pentaho ETL, Talend и пр.);
- Знакомство со стеком Apache Hadoop (HDFS, HBase, Cassandra) и SQL-движками для анализа данных, хранящихся в распределенных файловых системах типа HDFS (Apache Hive, Impala и пр.);
- Опыт работы с Big Data на базе Apache (Hadoop, Kafka, Spark);
- Знание языков программирования Python (предпочтительно), Java или Scala для работы с Big Data системами;
- Опыт работы с Linux и Windows.
Условия:
- Комфортный офис в центре – ст. м. Бауманская;
- Возможность удаленной работы;
- Конкурентную заработную плату;
- Привлекательный социальный пакет с расширенной медицинской страховкой, годовым бонусом по итогам работы, корпоративной программой лояльности;
- Корпоративный университет, изучение английского языка, электронная библиотека, профессиональные курсы и конференции;
- Насыщенная корпоративная жизнь: тимбилдинги, корпоративные клубы, спортивные мероприятия (мини-футбол, баскетбол, волейбол, яхтенный клуб, клуб по триатлону).