Data scientist / Team Lead Data Science
Требования
Местоположение и тип занятости
Компания
ИТ-интегратор Госкорпорации «Росатом»
Описание вакансии
Условия работы
АО "Гринатом" – ведущий ИТ-интегратор Госкорпорации «Росатом». Мы:
- реализуем важнейшие проекты развития цифровой экосистемы атомной отрасли;
- Входим в ТОП -3 лучших ИТ-работодателей России 2020 по рейтингу Хабр Карьеры;
- Нас уже более 5 тысяч сотрудников в 22 филиалах.
Обязанности:
- Разработка ml-сервисов для крупных проектов в области закупок компании (наша основа - Python, Anaconda);
- Исследование и применение новых технологий в области машинного обучения и анализа больших данных;
- Исследование, разработка, применение и развитие технологий OCR и интеллектуального поиска;
- Сбор, систематизация и анализ данных с использованием разработанных алгоритмов, а также их улучшение;
- Управление небольшой командой DS-проекта;
- На основании проведенного анализа: построение гипотез и предположений для оптимизации и повышения эффективности бизнес-процессов и технологических процессов;
- Подготовка аналитических отчетов;
- Разработка backend-сервисов с использованием Django, Flask, HUG для работы с моделью;
- Контроль работы команды по Kanban (мы используем JIRA, Confluence, Gitlab. Выстраиваем правильный CI/CD и всячески за правильную и трендовую разработку);
- Формирование задач на команду, код ревью;
- Взаимодействие с бизнесом в процессе постановки и реализации задачи, поиск оптимальных архитектурных и бизнес решений, отстаивание своей точки зрения развития продуктов;
- Контроль и мониторинг результатов качества получаемых данных;
Требования:
- Техническое образование;
- Опыт работы на аналогичной должности от 2-ух лет;
- Анализ долгосрочной стратегии развития ml-проекта;
- Прогнозирование потоков данных;
- Уверенное знание Python как с точки зрения разработки алгоритмов ML, так и для создания скриптов и backend-приложений, работающих с моделями;
- Уверенное владение основными библиотеками машинного обучения и нейронных сетей (pandas, numpy, sklearn, matplotlib, seaborn, lightgbm/xgboost/catboost/fasttext/, BERT, keras, tensorflow);
- Опыт вывода моделей в прод;
- Знания SQL: написания запросов, знания Microsoft SQL, PostgreSQL;
- Знание основ теории вероятности и математической статистики;
- Методы и алгоритмы data mining: кластеризация, регрессия, классификация;
- Дискретные алгоритмы, структуры данных;
- Умение анализировать, визуализировать данные, проверять и выстраивать гипотезы, делая все это в Jupyter Notebook.
- Знание GIT;
- Опыт создания backend-приложений, работающих с моделью на Django, Flask, HUG;
- Понимание выбора правильных фреймворков для backend;
- Опыт работы с Docker, менеджмент контейнеров;
- Наличие завершенных проектов обязательно;
- Опыт работы с Kafka, RabbitMQ, Apache NiFi;
- Опыт с Hadoop, Spark, Hive, Clickhouse, Greenplum;
- Знания и понимание выстраивания правильной архитектуры ML-проекта;
- Опыт клиент-серверной разработки;
Будет плюсом:
- Понимание, что такое Kanban и Agile;
- Опыт работы с JIRA, Confluence, Gitlab;
- Умение презентовать свои результаты в виде небольшого SPA-приложения. Мы работаем с JS, React, MobX;
- Опыт работы в DataLake-проектах;
- Ты коммуникабельный, позитивный и любишь творчески подходить к решению задач;
Бонусы
Что можем предложить:
- Официальное оформление по ТК, белая зп; годовая премия;
- Плавающее начало дня;
- Дополнительные 3 дня к отпуску;
- Работу над интересными (и сложными) продуктами/проектами;
- Опытная команда, готовая к активному сотрудничеству (партнерству, дружбе);
- Быстрый темп. У нас не соскучишься;
- ДМС со стоматологией, гибкий график, конференции.