Data scientist / Team Lead Data Science

5 апреля 2021

Требования

Аналитика, Ведущий (Lead) • Python • SQL • PostgreSQL • Docker • Django • Flask • Apache Kafka • RabbitMQ • Apache Hadoop

Местоположение и тип занятости

• Полный рабочий день • Можно удаленно

Компания

Гринатом

ИТ-интегратор Госкорпорации «Росатом»

Описание вакансии

Условия работы

АО "Гринатом" – ведущий ИТ-интегратор Госкорпорации «Росатом». Мы:

реализуем важнейшие проекты развития цифровой экосистемы атомной отрасли;
Входим в ТОП -3 лучших ИТ-работодателей России 2020 по рейтингу Хабр Карьеры;
Нас уже более 5 тысяч сотрудников в 22 филиалах.

Ищем в нашу команду Data scientist / Team Lead Data Science.

Обязанности:

Разработка ml-сервисов для крупных проектов в области закупок компании (наша основа - Python, Anaconda);
Исследование и применение новых технологий в области машинного обучения и анализа больших данных;
Исследование, разработка, применение и развитие технологий OCR и интеллектуального поиска;
Сбор, систематизация и анализ данных с использованием разработанных алгоритмов, а также их улучшение;
Управление небольшой командой DS-проекта;
На основании проведенного анализа: построение гипотез и предположений для оптимизации и повышения эффективности бизнес-процессов и технологических процессов;
Подготовка аналитических отчетов;
Разработка backend-сервисов с использованием Django, Flask, HUG для работы с моделью;
Контроль работы команды по Kanban (мы используем JIRA, Confluence, Gitlab. Выстраиваем правильный CI/CD и всячески за правильную и трендовую разработку);
Формирование задач на команду, код ревью;
Взаимодействие с бизнесом в процессе постановки и реализации задачи, поиск оптимальных архитектурных и бизнес решений, отстаивание своей точки зрения развития продуктов;
Контроль и мониторинг результатов качества получаемых данных;

Требования:

Техническое образование;
Опыт работы на аналогичной должности от 2-ух лет;
Анализ долгосрочной стратегии развития ml-проекта;
Прогнозирование потоков данных;
Уверенное знание Python как с точки зрения разработки алгоритмов ML, так и для создания скриптов и backend-приложений, работающих с моделями;
Уверенное владение основными библиотеками машинного обучения и нейронных сетей (pandas, numpy, sklearn, matplotlib, seaborn, lightgbm/xgboost/catboost/fasttext/, BERT, keras, tensorflow);
Опыт вывода моделей в прод;
Знания SQL: написания запросов, знания Microsoft SQL, PostgreSQL;
Знание основ теории вероятности и математической статистики;
Методы и алгоритмы data mining: кластеризация, регрессия, классификация;
Дискретные алгоритмы, структуры данных;
Умение анализировать, визуализировать данные, проверять и выстраивать гипотезы, делая все это в Jupyter Notebook.
Знание GIT;
Опыт создания backend-приложений, работающих с моделью на Django, Flask, HUG;
Понимание выбора правильных фреймворков для backend;
Опыт работы с Docker, менеджмент контейнеров;
Наличие завершенных проектов обязательно;
Опыт работы с Kafka, RabbitMQ, Apache NiFi;
Опыт с Hadoop, Spark, Hive, Clickhouse, Greenplum;
Знания и понимание выстраивания правильной архитектуры ML-проекта;
Опыт клиент-серверной разработки;

Будет плюсом:

Понимание, что такое Kanban и Agile;
Опыт работы с JIRA, Confluence, Gitlab;
Умение презентовать свои результаты в виде небольшого SPA-приложения. Мы работаем с JS, React, MobX;
Опыт работы в DataLake-проектах;
Ты коммуникабельный, позитивный и любишь творчески подходить к решению задач;

Бонусы

Что можем предложить:

- Официальное оформление по ТК, белая зп; годовая премия;

- Плавающее начало дня;

- Дополнительные 3 дня к отпуску;

- Работу над интересными (и сложными) продуктами/проектами;

- Опытная команда, готовая к активному сотрудничеству (партнерству, дружбе);

- Быстрый темп. У нас не соскучишься;

- ДМС со стоматологией, гибкий график, конференции.