👀 Дизайнеры, с какой командой вы мэтчитесь по вайбам? Проверяйте на Вайб-чеке→ vibe.habr.com

Data scientist / Team Lead Data Science

Местоположение и тип занятости

Полный рабочий деньМожно удаленно

Компания

ИТ-интегратор Госкорпорации «Росатом»

Описание вакансии

Условия работы

АО "Гринатом" – ведущий ИТ-интегратор Госкорпорации «Росатом». Мы:

  • реализуем важнейшие проекты развития цифровой экосистемы атомной отрасли;
  • Входим в ТОП -3 лучших ИТ-работодателей России 2020 по рейтингу Хабр Карьеры;
  • Нас уже более 5 тысяч сотрудников в 22 филиалах.
Ищем в нашу команду Data scientist / Team Lead Data Science.

Обязанности:

  • Разработка ml-сервисов для крупных проектов в области закупок компании (наша основа - Python, Anaconda);
  • Исследование и применение новых технологий в области машинного обучения и анализа больших данных;
  • Исследование, разработка, применение и развитие технологий OCR и интеллектуального поиска;
  • Сбор, систематизация и анализ данных с использованием разработанных алгоритмов, а также их улучшение;
  • Управление небольшой командой DS-проекта;
  • На основании проведенного анализа: построение гипотез и предположений для оптимизации и повышения эффективности бизнес-процессов и технологических процессов;
  • Подготовка аналитических отчетов;
  • Разработка backend-сервисов с использованием Django, Flask, HUG для работы с моделью;
  • Контроль работы команды по Kanban (мы используем JIRA, Confluence, Gitlab. Выстраиваем правильный CI/CD и всячески за правильную и трендовую разработку);
  • Формирование задач на команду, код ревью;
  • Взаимодействие с бизнесом в процессе постановки и реализации задачи, поиск оптимальных архитектурных и бизнес решений, отстаивание своей точки зрения развития продуктов;
  • Контроль и мониторинг результатов качества получаемых данных;

Требования:

  • Техническое образование;
  • Опыт работы на аналогичной должности от 2-ух лет;
  • Анализ долгосрочной стратегии развития ml-проекта;
  • Прогнозирование потоков данных;
  • Уверенное знание Python как с точки зрения разработки алгоритмов ML, так и для создания скриптов и backend-приложений, работающих с моделями;
  • Уверенное владение основными библиотеками машинного обучения и нейронных сетей (pandas, numpy, sklearn, matplotlib, seaborn, lightgbm/xgboost/catboost/fasttext/, BERT, keras, tensorflow);
  • Опыт вывода моделей в прод;
  • Знания SQL: написания запросов, знания Microsoft SQL, PostgreSQL;
  • Знание основ теории вероятности и математической статистики;
  • Методы и алгоритмы data mining: кластеризация, регрессия, классификация;
  • Дискретные алгоритмы, структуры данных;
  • Умение анализировать, визуализировать данные, проверять и выстраивать гипотезы, делая все это в Jupyter Notebook.
  • Знание GIT;
  • Опыт создания backend-приложений, работающих с моделью на Django, Flask, HUG;
  • Понимание выбора правильных фреймворков для backend;
  • Опыт работы с Docker, менеджмент контейнеров;
  • Наличие завершенных проектов обязательно;
  • Опыт работы с Kafka, RabbitMQ, Apache NiFi;
  • Опыт с Hadoop, Spark, Hive, Clickhouse, Greenplum;
  • Знания и понимание выстраивания правильной архитектуры ML-проекта;
  • Опыт клиент-серверной разработки;

Будет плюсом:

  • Понимание, что такое Kanban и Agile;
  • Опыт работы с JIRA, Confluence, Gitlab;
  • Умение презентовать свои результаты в виде небольшого SPA-приложения. Мы работаем с JS, React, MobX;
  • Опыт работы в DataLake-проектах;
  • Ты коммуникабельный, позитивный и любишь творчески подходить к решению задач;

Бонусы

Что можем предложить:

- Официальное оформление по ТК, белая зп; годовая премия;

- Плавающее начало дня;

- Дополнительные 3 дня к отпуску;

- Работу над интересными (и сложными) продуктами/проектами;

- Опытная команда, готовая к активному сотрудничеству (партнерству, дружбе);

- Быстрый темп. У нас не соскучишься;

- ДМС со стоматологией, гибкий график, конференции.