Инженер данных
Требования
Местоположение и тип занятости
Компания
Описание вакансии
О компании и команде
СБЕР ЕАПТЕКА – одна из крупнейших интернет-аптек в России. Мы меняем индустрию, чтобы сделать здоровье доступным для всех. Сейчас компания работает по всей России от Калининграда до Владивостока. Собственная сеть аптек-хабов превышает 250, а сеть пунктов самовывоза – 14000.
Сервис федерального масштаба в сегменте e-pharm строит сильная ИТ команда, разрабатывая надежную технологическую платформу, которая помогает клиентам заказывать лекарства и товары для здоровья онлайн.
Мы ждем в команде ответственных, проактивных и надежных людей, чтобы вместе развивать сервис, который делает жизнь лучше.
Мы в поиске Data Engineer
Обязанности:
- Участие во встречах с заказчиками;
- Работа с DWH, проектирование схем для хранения данных;
- Разработка процедур загрузки данных из различных источников (как внутренние БД, так и внешние аналитические/ маркетинговые платформы и т.д.) в DWH;
- Автоматизация и контроль ETL процессов;
- Автоматизация проверок качества данных;
- Формирование витрин данных;
- Составление технической документации по разрабатываемым витринам данных/интеграциям;
- Подготовка и поддержание в актуальном состоянии каталога метаданных;
- Организация CI/CD и мониторинга процессов обработки данных
Ожидания от кандидата
Требования:
- Сильные знания и опыт работы с хранилищами данных (DWH) от 3х лет (проектирование, системный анализ, разработку и оптимизацию);
- Понимание принципов организации хранилищ данных, принципов работы колоночных БД;
- Опыт работы с ETL-процессами и инструментами (Airflow, sql процедуры, Python);
- Продвинутые знания Python (необходимо в том числе для работы с Airflow);
- Понимание организации CI/CD в GitLab;
- Уверенное знание SQL, умение строить сложные запросы, понимать как работать с планом запроса и как на его основе оптимизировать производительность (MS SQL обязательно, GreenPlum желательно);
- Опыт работы с Docker
Будет плюсом:
- Опыт разработки DWH на Greenplum, понимание специфики работы GreenPlum;
- Опыт работы с Apache Spark и Spark Structured Streaming;
- Опыт работы с Microsoft OLAP;
- Опыт работы с ClickHouse (шардирование, репликация и т.п.);
- Опыт работы с источником данных 1С;
- Понимание рынка ecommerce/ритейла.
Условия работы
Условия:
- Работа в аккредитованной ИТ компании;
- График: 5/2, гибкое начало рабочего дня с 8:00 до 10:00, гибридный/удаленный формат работы;
- ДМС;
- Перспективы профессионального роста: пополняемая коллекция; профессиональной литературы, оплата посещения профильных конференций;
- Современная техника;
- Корпоративные мероприятия и тимбилдинги