Data Инженер

Местоположение и тип занятости

МоскваПолный рабочий деньМожно удаленно

Компания

Российский телеком-оператор с 50 миллионами клиентов и 30 тысячами сотрудников

Описание вакансии

О компании и команде

Создание и развитие цифровых инструментов, улучшающих клиентский опыт, занимает ключевое место в стратегии Билайн. Здесь ждет работа с самыми современными технологиями и продуктами на базе AI, Big Data, 5G и других; гибкость и самостоятельность в планировании задач, возможность предлагать идеи и развивать экспертизу внутри. В феврале 2020 года Билайн был признан одним из самых привлекательных работодателей для IT-специалистов (по версии Хабр Карьера). Наша сильная сторона – это также и люди – профессионалы, готовые поделиться опытом, советом и поддержать тебя в работе над проектом.

Если ты готов решать по-настоящему сложные задачи, которые, возможно, до тебя не решал никто, обладаешь аналитическими способностями, тебя не пугают масштабные проекты и профессиональные вызовы – присоединяйся!

И сейчас у тебя есть возможность присоединиться к лучшей команде в качестве DATA Инженера!

Ожидания от кандидата

Мы будем рады рассмотреть твою кандидатуру, если у тебя есть:

  • любовь к работе в команде и ты умеешь это делать;
  • опыт с SQL на высоком уровне (в т. ч. DDL, табличные выражения, оконные функции);
  • опыт работы с Hive, PostgreSQL ;
  • опыт разработки ETL процессов Spark на Scala (потоковая обработка как преимущество);
  • опыт: можешь что-то написать на Python – в объеме, чтобы пользоваться AirFlow или еще круче;
  • умение проектировать базы данных (знает Data Vault 2.0 например);
  • понимание принципов работы реляционных СУБД и HDFS;
  • представление о колоночных и NoSQL СУБД;
  • понимание подходов к работе с качеством данных.

На твоей стороне возможности для роста и обучения

Условия работы

Итак, твои обязанности:

  • Анализ требований к витринам данных (взаимодействие с владельцем продукта, BI-разработчиками, datascientist-ами);
  • Поиск и исследование источников данных для последующей интеграции во внутренних витринах;
  • Оценка пригодности, качества исходных данных;
  • Разработка ETL процессов на Spark;
  • Оркестрация ETL процессов в Airflow;
  • Проектирование баз данных.