Data-инженер (команда Big Data Infrastructure)

27 декабря 2022

Требования

Инженер по данным, Старший (Senior) • Apache Kafka • Apache Hadoop • Python • Java • Scala • ClickHouse • Apache Spark

Местоположение и тип занятости

• Полный рабочий день • Можно удаленно

Компания

Место встречи лучших

Описание вакансии

Условия работы

Мы занимаемся развитием и поддержкой платформы Big Data на vk.com. Она построена как на проверенных решениях с открытым исходным кодом (Hadoop, Kafka, Spark, Zeppelin), так и на собственных разработках, заточенных под работу 24/7 в условиях высоких нагрузок.

Самая большая социальная сеть России - самая большая Big Datа!

Kafka: ~1PB
HDFS: ~50PB
Clickhouse: ~3PB (nvme)

Для нас важно отлично разбираться в любом из этих инструментов. Любим Spark. Пишем на любых языках, но особенно на Java/Scala и Python.

Стек: Hadoop, HDFS, Kafka, Spark, Zeppelin, Airflow, Zookeeper, Clickhouse, Python, Java, Scala.

Задачи:

развивать платформу хранения и обработки больших данных;
внедрять новые инструменты для анализа данных и машинного обучения;
решать задачи производительности и отказоустойчивости инфраструктуры Big Data;
строить новые и оптимизировать существующие ETL-процессы.

Требования:

хорошее знание Java/Scala, Python;
знание принципов работы баз данных, распределенных систем хранения и обработки данных;
опыт работы и понимание внутреннего устройства: Hadoop, HDFS, Kafka, Spark, Zeppelin, Airflow, Zookeeper, Clickhouse.

Смотреть ещё вакансии

Scala разработчик

Java разработчик

244

Data Scientist

Data Scientist удаленно

Scala разработчик удаленно

Java разработчик удаленно

170

Scala разработчик на полный рабочий день удаленно

Data Scientist на полный рабочий день удаленно

Java разработчик на полный рабочий день удаленно

151

Scala разработчик на полный рабочий день