Senior Data Analyst/Data Engineer
Требования
Местоположение и тип занятости
Компания
Описание вакансии
Условия работы
ГРУППА НЛМК – лидирующий международный производитель высококачественной стальной продукции с вертикально-интегрированной моделью бизнеса. Добыча сырья и производство стали сосредоточены в низкозатратных регионах, изготовление готовой продукции осуществляется в непосредственной близости от основных потребителей в России, Северной Америке и странах ЕС.
Команда цифровизации логистики и управления цепями поставок ищет специалиста по анализу данных, который будет помогать с развитием цифровых продуктов - проверкой продуктовых гипотез на основе данных, принятием data-driven решений
ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ:
- Сбор требований к данным на основе продуктовой гипотезы, определение систем-источников данных
- Общение с пользователями систем-источников данных, подключение к системам источникам (на базе Postgres, MS SQL, Oracle, SAP) – проверка наличия, качества данных
- Сбор, очистка, подготовка данных к использованию в аналитических сервисах
- Проектирование реляционных БД/data lake с несколькими слоями: сбора, хранения, агрегации, представления (view) данных
- Построение и первичная настройка БД на базе Postgres
- Написание этапов ETL пайплайнов – аналитических скриптов объединения, преобразования данных, расчета агрегированных показателей -> передача скриптов команде разработки
- Проведение разведочного анализа данных, подготовка и оформление выводов о качестве, надежности данных, значениях показателей и устойчивости этих значений
- Проведение статистических тестов, визуализация результатов проверки статистических гипотез, анализ результатов базового A/B тестирования
- Написание технических спецификаций для разработчиков на передачу данных из систем-источников в БД микросервисов
- Adhoc аналитика: написание запросов к БД, формирование view под запрос проектных команд
ТРЕБОВАНИЯ:
- Высшее образование
- Опыт работы от 3-х лет в области анализа данных
- Уверенное владение SQL
- Опыт создания и поддержки DWH
- Понимание принципов работы SQL ориентированных БД (механизм транзакций, реляционные БД и нормальные формы), понимание механизмов работы data lake (слои ODS, DDS, CDM, DM)
- Умение оперативно погрузиться в задачу, изучить нюансы и технологию бизнес-процесса, сформулировать и протестировать гипотезы, интерпретировать результаты анализа, наглядно объяснять и аргументировать выводы
БУДЕТ ПЛЮСОМ:
- Опыт работы с системами-брокерами данных (Kafka, Redis, RabbitMQ), системами распределенных вычислений (Hadoop, Spark)
- Библиотеками Python для анализа данных (Numpy, Pandas, scipy, stats, statsmodels)
- Умение наглядно визуализировать результаты анализа на базе Python (seaborn, plotly) или Tableu/Power BI
- Приветствуются практические навыки работы с библиотеками машинного обучения (state-of-the-art модели из sklearn)
- Базовые знания статистики – умение строить и сравнивать распределения, проводить стат. тесты
Бонусы
- Работа в молодой, динамичной команде в крупной международной компании
- Возможность разрабатывать и переводить в продуктив решения, напрямую влияющие на производственный процесс
- Конкурентная ЗП, ежегодный бонус, премирование за оптимизационные проекты, ДМС, оплата мобильной связи
- Работа в офисе или удаленно (на ваш выбор)
- Офис в центре Москвы (Третьяковская).