Data Architect (Архитектор данных)
Зарплата
от 300 000 ₽
Требования
Местоположение и тип занятости
Компания
Мы строим DIY будущего
Описание вакансии
Условия работы
Наша команда развивает Data-driven подход, собранные данные применяем для машинного обучения и аналитики. Меняем классический ритейл в digital. Мы гибкие. У нас высокая скорость принятия решений и полностью горизонтальная структура. Мы не говорим Big Data - говорим Data Value; не Batch, а Streaming. Не Legacy, а Open Source. Не OnPremise, а Cloud.
Стек технологий: Nifi, Spark, Kafka, Greenplum, S3, Gitlab.
Обязанности:
- Определение архитектуры платформы данных и роадмапа её развития;
- Определение необходимых инструментов реализации архитектурных решений в рамках технологического стека, используемого в Компании;
- Документирование предлагаемых архитектурных решений;
- Определение критериев эффективности реализации архитектурных решений (в т.ч., критерии производительности и безопасности);
- Реализация прототипов архитектурных решений;
- Участие в определении принципов и схем интеграции информационных систем Компании;
- Документирование интеграционного взаимодействия между информационными системами;
- Обеспечение требований безопасности в реализуемых процессах обработки и хранения данных;
- Обеспечение требований логирования и мониторинга в реализуемых процессах обработки данных;
- Определение необходимых видов тестирования на основании ранее выработанных критериев эффективности реализации архитектурных решений;
- Определение требований по качеству данных;
- Консультирование по любым техническим вопросам, относящимся к функциональности платформы данных, обучение пользователей.
Требования:
- Знание архитектурных принципов построения информационных систем и типовых паттернов (лямбда-архитектура, каппа-архитектура, микросервисный подход и т.д.)
- Опыт проектирования и разработки архитектуры платформы данных в целом и отдельных компонентов (операционная аналитика, Data Lake, DWH, метаданные и т.д.)
- Опыт разработки стратегии и роадмапа развития платформы данных;
- Опыт разработки DWH архитектуры, модели данных, ETL процессов;
- Опыт работы с реляционными и NoSql базами данных PostgreSql, Teradata, MongoDB, MsSql, Oracle, GreenPlum, Clickhouse;
- Владение языками программирования: Python / Java / Scala;
- Умение расставлять приоритеты и работать одновременно над несколькими задачами;
- Знание инструментов потоковой и пакетной обработки (Spark, NiFi и т.д.)
- Опыт разработки технической документации;
- Готовность писать код (SQL, Python, etc.);
- Опыт использования schedulers and workflow-management systems: Airflow;
- Опыт работы с очередями сообщений – RabbitMQ, Kafka;
- Знание принципов DevOps и инструментов IaaC (Ansible, Terraform)
- Опыт использования инструментов CI/CD (Jenkins)
- Опыт работы с BI-инструментами (PowerBI, Tableau)
- Опыт работы в аналогичной должности.
- Опыт использования инструментария MLOps (DVC, MLFlow)
- Опыт работы с Docker и Kubernetes
- Владение Golang.
Желательно:
- Опыт работы с облачными провайдерами - GCP (BigQuery, GCS) и локальные провайдеры (Yandex Cloud, Mail.ru Cloud)
- Желательно знание английского языка (от intermediate).
Бонусы
Условия:
- Оформление по ТК РФ, оплата больничного и отпуска;
- Возможность профессионального развития и карьерного роста;
- Оплачиваемый полис добровольного медицинского страхования (включая стоматологию) и полиса страхования заграницей после 3 месяцев работы в компании;
- Компенсация питания и мобильной связи;
- Офис в 5 минутах от метро Шаболовская.
- Участие в конференциях и во внутренних, и внешних митапах;
- Гибкий график и возможность работать удалённо.