Data scientist
Требования
Местоположение и тип занятости
Компания
Описание вакансии
Условия работы
Мы, Отдел мониторинга и анализа данных, занимаемся разработкой статистических моделей и алгоритмов машинного обучения в первую очередь для направлений Производства и Качества. В будущем планируем развивать ML практики и внедрять их в другие сферы компании.
Подробнее о том, что мы делаем:
- Проводим explorative-анализ данных, делаем пилоты для подтверждения гипотезы о том, что можно решить поставленную заказчиком задачу с помощью ML и статистики;
- Выявляем аномалии в time-series (отказ датчиков, нестандартные режимы работы и т.п.);
- Пишем понятный и поддерживаемый код, делаем качественные, воспроизводимых пайплайны обучения моделей;
- Брейнштормим и генерируем идеи всей командой.
О том как мы собираем данные для экспериментов можно почитать в нашей статье: habr.com/ru/company/biocad/blog/586124/
Наш стэк: Python, MongoDB, PostgreSQL, Apache NIFI, PySpark, MLFlow, git.
Пример проектов, над которыми сейчас работает команда:
- Построение модели адаптивного регулятора для замены PID-регулятора;
- Поиск аномалий в сигналах датчиков;
Некоторое представление о наших заказчиках можно получить, прочтя их статью: habr.com/ru/company/biocad/blog/564902/
Сейчас в команде 4 data scientist. Мы расширяем команду и ищем еще одного уровня middle/senior.
Задачи, которыми предстоит заниматься:
- Погружаться в предметные области, работать с заказчиками;
- Выполнять исследовательские задачи, искать причинно-следственные связи;
- Проявлять инициативу, предлагать собственные гипотезы;
- Создавать осмысленные модели;
- Участвовать в разработке архитектуры ML сервисов;
- Документировать и презентовать результаты работы.
Требования:
- Наличие практических достижений в области ML;
- Знание статистики и умение ее применять (Методы статистического вывода, проверка гипотез, statsmodels);
- Уверенный Python, Git;
- Опыт работы с базами данных: оконные функции, индексы, оптимизация запросов (postgres, mongo);
- Желание разбираться в предметной области, работать с заказчиками.
Бонусы
- Территориальное месторасположение – м. Гостиный Двор, Бутик-офис центр "Пассаж", возможность удаленной работы;
- График работы: 5/2, с 09.30 до 18.00 (по пятницам до 17.30);
- Конкурентоспособная заработная плата;
- Участие в социально значимых проектах;
- Широкие возможности для профессионального и карьерного роста.
Дополнительные инструкции
Будет плюсом:
- Наличие опыта по выводу ML решений в prod (очень большой плюс);
- Знакомство ETL (Airflow, NiFi) или готовность разбираться в нем;
- MLFlow;
- Опыт работы с Power BI;
- Умение работать с Docker контейнерами;
- Terminal (Linux);
- Знание фреймворков TensorFlow/PyTorch;