Разработчик ETL(Hadoop)
Требования
Местоположение и тип занятости
Компания
Описание вакансии
Условия работы
Иннотех — современная быстроразвивающаяся аккредитованная IT-компания с фокусом на высокие технологии. Мы выросли до 10 000+ человек менее чем за два года. Вместе мы создаем финтех, который будет доступен каждому: развиваем «Цифровую банковскую платформу», выстраиваем партнерские отношения с топовыми финансовыми компаниями, создаем комплексные решения для фронт- и бэк-офисов, строим системы работы с большими данными.
В Иннотех стабильность работы — финансовая надежность, социальные гарантии, бонусы и бенефиты, — сочетается с преимуществами IT-компании — открытость, инновации, гибридный формат работы.
Мы стремительно растем, масштабируемся и ищем новых специалистов в команду!
Выполнение аналитики по данным (Витрины данных, Хранилище данных, системы- источники данных) в процессах команды "DDS/КИБ/СМБ". Анализ причин, которые привели к построению ошибок качества данных. Разработка контролей по Качеству данных и создание инцидентов Качества данных.
Вместе с нами ты будешь:
- Выполнение функциональных обязанностей в рамках проекта по Миграции Платформ Данных (Arenadata Hadoop)
- Обеспечение загрузки необходимых данных в Data Lake или необходимые витрины данных
- Проектирование и разработка, тестирование и внедрение ETL процессов, используя ETL Framework и конвейер данных
- Реализация различных интеграций в гетерогенной среде с помощью Python/Spark
- Оптимизация существующего кода и используемых платформ
- Конфигурация потоков данных из систем источников, их мониторинг, своевременную модификацию, оптимизацию
- Оптимизация конвейера данных и ETL-процессов для поддержания процессов проверки качества данных
- Контейнеризация процессов загрузки/выгрузки данных в Data Lake
Какие знания и навыки для нас важны:
- Опыт работы в роли разработчика на стеке Hadoop не менее 2-х лет
- Опыт разработки приложений с использованием инструментария экосистемы Hadoop (Spark streaming, Hbase, Spark SQL, KAfka, Hive, Impala, Hue и т.д.)
- Опыт разработки на Java / Python / Spark / Scala
- Понимание принципов модели распределенных вычислений
- Опыт разработки ETL / Self service ETL процессов по наполнению данными Data Lake, формирование витрин данных на Hadoop желателен
- Опыт решения ETL/data engineering задач
- Опыт реализации интеграции в гетерогенных средах
- Навыки работы с системами контроля версий / репозиториями кода на основе Git
- Успешный опыт работы в команде от 7 человек
- Понимание методологий Agile/Scrum
- Знание Unix/Linux, навыки работы в shell
- Опыт развертывания Linux серверов/ контейнеров, использования скриптовых языков (Bash) как преимущество
- Базовые знания работы kerberos как преимущество
- Знание и опыт работы с инструментами DevOPS рассматривается как преимущество
Бонусы
- гибкий график работы — в офисе, удаленно или в гибридном формате
- поддержка новичков по программе наставничества Buddy
- ДМС с возможностью подключения близких родственников
- сервис психологической поддержки, ведь нам очень важно, как ты себя чувствуешь
- корпоративный кафетерий льгот с возможностью компенсации билетов и отелей в отпуске, абонементов в спортзал, спортинвентаря, билетов в театр и многого другого
- насыщенная инножизнь: лекции и мастер-классы от известных спикеров, тимбилдинги, корпоративная библиотека и многое другое
- скидки и купоны от сотен компаний-партнёров на единой платформе
- маркетплейс мерча с собственной корпоративной валютой, которая начисляется за участие в активностях
- дополнительные выходные в дни радостных (и не только) событий
- дополнительный оплачиваемый отпуск (3 календарных дня)
- широкие возможности внутреннего и внешнего обучения
- необходимая техника и софт для работы
- конкурентная зарплата по итогам интервью, наличие премиальной составляющей