👀 Дизайнеры, с какой командой вы мэтчитесь по вайбам? Проверяйте на Вайб-чеке→ vibe.habr.com

Senior Data Analyst/Data Engineer

Местоположение и тип занятости

МоскваПолный рабочий день

Компания

Лидирующий международный производитель высококачественной стальной продукции

Описание вакансии

Условия работы

ГРУППА НЛМК – лидирующий международный производитель высококачественной стальной продукции с вертикально-интегрированной моделью бизнеса. Добыча сырья и производство стали сосредоточены в низкозатратных регионах, изготовление готовой продукции осуществляется в непосредственной близости от основных потребителей в России, Северной Америке и странах ЕС.

Команда цифровизации логистики и управления цепями поставок ищет специалиста по анализу данных, который будет помогать с развитием цифровых продуктов - проверкой продуктовых гипотез на основе данных, принятием data-driven решений

ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ:

  • Сбор требований к данным на основе продуктовой гипотезы, определение систем-источников данных
  • Общение с пользователями систем-источников данных, подключение к системам источникам (на базе Postgres, MS SQL, Oracle, SAP) – проверка наличия, качества данных
  • Сбор, очистка, подготовка данных к использованию в аналитических сервисах
  • Проектирование реляционных БД/data lake с несколькими слоями: сбора, хранения, агрегации, представления (view) данных
  • Построение и первичная настройка БД на базе Postgres
  • Написание этапов ETL пайплайнов – аналитических скриптов объединения, преобразования данных, расчета агрегированных показателей -> передача скриптов команде разработки
  • Проведение разведочного анализа данных, подготовка и оформление выводов о качестве, надежности данных, значениях показателей и устойчивости этих значений
  • Проведение статистических тестов, визуализация результатов проверки статистических гипотез, анализ результатов базового A/B тестирования
  • Написание технических спецификаций для разработчиков на передачу данных из систем-источников в БД микросервисов
  • Adhoc аналитика: написание запросов к БД, формирование view под запрос проектных команд

ТРЕБОВАНИЯ:

  • Высшее образование
  • Опыт работы от 3-х лет в области анализа данных
  • Уверенное владение SQL
  • Опыт создания и поддержки DWH
  • Понимание принципов работы SQL ориентированных БД (механизм транзакций, реляционные БД и нормальные формы), понимание механизмов работы data lake (слои ODS, DDS, CDM, DM)
  • Умение оперативно погрузиться в задачу, изучить нюансы и технологию бизнес-процесса, сформулировать и протестировать гипотезы, интерпретировать результаты анализа, наглядно объяснять и аргументировать выводы

БУДЕТ ПЛЮСОМ:

  • Опыт работы с системами-брокерами данных (Kafka, Redis, RabbitMQ), системами распределенных вычислений (Hadoop, Spark)
  • Библиотеками Python для анализа данных (Numpy, Pandas, scipy, stats, statsmodels)
  • Умение наглядно визуализировать результаты анализа на базе Python (seaborn, plotly) или Tableu/Power BI
  • Приветствуются практические навыки работы с библиотеками машинного обучения (state-of-the-art модели из sklearn)
  • Базовые знания статистики – умение строить и сравнивать распределения, проводить стат. тесты


Бонусы


  • Работа в молодой, динамичной команде в крупной международной компании
  • Возможность разрабатывать и переводить в продуктив решения, напрямую влияющие на производственный процесс
  • Конкурентная ЗП, ежегодный бонус, премирование за оптимизационные проекты, ДМС, оплата мобильной связи
  • Работа в офисе или удаленно (на ваш выбор)
  • Офис в центре Москвы (Третьяковская).