Teamlead Data Scientist ML

Местоположение и тип занятости

Полный рабочий деньМожно удаленно

Компания

Создаем передовые IT-решения для металлургической отрасли

Описание вакансии

О компании и команде

НЛМК- международная сталелитейная компания с активами в России, США и пяти странах Европы.

Производство вертикально интегрировано, это позволяет контролировать всю цепочку создания металлопродукции от добычи сырья до финальной обработки и поставки стали потребителям.

В рамках трехлетней стратегии компании мы планируем разработать и внедрить принципиально новые системы, учитывающие лучшие практики мирового опыта учета производства, в микросервисной архитектуре на современном стеке технологий. Сейчас мы в поиске Data Scientist

Ожидания от кандидата

ВАС ЖДЕТ:

  • Анализ доступных источников данных, объективная оценка их качества, поиск способов работы с теми наборами, которые есть в наличии;
  • Анализ специализированной и отраслевой литературы с целью обогащения моделей новыми признаками;
  • Разработка полного пайплайна моделей машинного обучения (первичная обработка данных, обучение модели, анализ метрик, визуализация, внедрение в сервис, контроль деградации);
  • Оперативное создание / доработка моделей под требования и приоритеты владельца продукта «без ТЗ»;
  • Активное участие в тестировании и внедрении сервисов, использующих модели.

МЫ ЖДЕМ ОТ ВАС:

  • Знание методов математического моделирования, машинного обучения, статистики, оптимизации. Умение оперативно погрузиться в производственную задачу, изучить нюансы производства и технологий;
  • Уверенное владение библиотеками Python (Numpy, Pandas, SciPy, Statsmodels), умение визуализировать данные seaborn, plotly;
  • Опыт применения библиотек машинного обучения XGBoost, CatBoost, Scikit-learn. Умение строить ансамбли моделей с использованием sklearn;
  • Понимание пайплайна работы с временными рядами, владение библиотеками для генерации признаков;
  • Опыт решения оптимизационных задач с использованием scipy, gurobipy и др.;
  • Знание методов интерпретации black box моделей (SHAP, Monoforest) и умение применять их на практике будет плюсом;
  • Опыт работы с TensorFlow (Keras) или PyTorch, знание основных архитектур нейросетей будет плюсом;
  • Опыт работы с GitLab, Jira, Confluence.

Условия работы

  • Лучшие практики мирового опыта учета производства, в микросервисной архитектуре на современном стеке. У нас технологическая платформа, на которой внедрено большинство сервисов управления жизненным циклом разработки;
  • Удаленный график работы;
  • Конкурентный уровень заработной платы и ежегодная индексация;
  • Возможность принять участие в интересных и сложных проектах с лучшими специалистами индустрии.