Data engineer (Python, Hadoop, Spark)

22 июля 2021

Требования

Инженер по данным, Старший (Senior) • Apache Hadoop • Apache Spark • Python

Местоположение и тип занятости

Москва • Полный рабочий день • Можно удаленно

Компания

X5 Tech

IT-компания и основной цифровой партнер торговых сетей и бизнесов X5 Group

Описание вакансии

Условия работы

X5 GROUP - ведущая компания современной розничной торговли, управляет портфелем брендов магазинов "Пятёрочка", "Перекресток" и "Карусель" и "Чижик".

В подразделении "Х5 Технологии" открыто несколько позиций Data engineer

Прогнозирования спроса: модели машинного обучения и алгоритмы, на основе данных по чекам и остаткам предупреждают сотрудников магазинов о том, что надо проверить/положить товар на полки. Продукт прошел стадию пилот (600 магазинов) и теперь дорабатывается и масштабируется на 17+ тыс. магазинов. Команда: ≈10 человек

Стек

«Планирование ассортимента». Поддержка принятия решений. +ML-алгоритмы выбора товаров для магазина в зависимости от локации и соц.дем. >15 000 магазинов
Проект в стадии развития и масштабирование проекта. Команда: ≈10 человек
Стек: Python 3.5-3.8., Fastapi, Hadoop, PySpark + Airflow. PostgreSQL, Kafka, Kibana, ElasticSearch. Docker, K8s, GitLab.

Основные задачи (детальнее расскажем на собеседовании):

Написание пайплайнов по работе с данными с использованием Airflow, Spark (пример: регулярный расчет фичей для модели, построение витрин с данными. их обновление, расчет метрик качества данных для мониторинга)
Оптимизация расчета фичей для модели для выдерживания SLA при масштабировании продукта под большее количество магазинов
Настройка мониторинга и алертинга качества данных и фичей с использованием Zabbix, Grafana
Написание unit тестов (pytest), тестов для различных участков ML пайплайна, участие в код ревью
Ну обязательно, но будет большим плюсом: опыт работы с ML, выведения ML моделей в продакшн

Мы сможем рассмотреть на вакансию кандидатов, у которых есть:

Опыт работы с Python от 2 лет
Опыт с Hadoop, Hive, Spark
Знание SQL (чтобы писать и оптимизировать запросы)
Знание классических алгоритмов и структур данных
Опыт работы с docker (kubernetes, pyspark, airflow и ds фреймворков python– не обязательно, но будет плюсом)
Умение пользоваться git'ом и работать в команде

Бонусы

Мы предлагаем:

схему мотивации: Fix + годовой бонус (20% годового оклада)
удобный офис у м. Парк Культуры или удаленную работу
гибкий график работы (с 8/9/10 утра)
обратную связь, возможность профессионального и карьерного роста (2 раза в год оценка персонала)
возможность обучаться и сертифицироваться за счёт компании: внешние тренинги и семинары по профессиональным тематикам, отраслевые конференции, программа развития управленческих навыков, очные мастер-классы, платформы онлайн-образования и многое другое
яркую корпоративную жизнь с большим количеством мероприятий, конкурсов и возможностей для творческой реализации
широкий пакет ДМС (включая выезд за рубеж и стоматологию)
страхование жизни и здоровья
скидки в магазинах сети Х5 («Пятёрочка», «Перекрёсток», «Карусель»)
программу привилегий Prime-zone (скидки на товары и услуги и специальные предложения от компаний-партнёров)
материальную помощь сотрудникам, попавшим в сложную жизненную ситуацию
Само собой, оформление по ТК РФ с официальной заработной платой;

Дополнительные инструкции

Татьяна Бурцева, +7 926 825 68 48, по номеру WhatsApp и Telegram @TABurtseva. E-mail, на всякий случай, T.Burtseva@x5.ru

Проще всего написать в телеграмм ФИО, указать, что отклик на вакансию, Ваш номер сотового, и я свяжусь с Вами.

Смотреть ещё вакансии

Python developer

470

Python developer удаленно

328

Python developer в Москве удаленно

Python developer в Москве

190

Python developer в Москве на полный рабочий день удаленно

Python developer на полный рабочий день удаленно

304

Python developer в Москве на полный рабочий день

165

Python developer на полный рабочий день

422