👀 Дизайнеры, с какой командой вы мэтчитесь по вайбам? Проверяйте на Вайб-чеке→ vibe.habr.com

Data scientist

Местоположение и тип занятости

Санкт-ПетербургПолный рабочий день

Компания

Инновационная биотехнологическая компания полного цикла

Описание вакансии

Условия работы

Мы, Отдел мониторинга и анализа данных, занимаемся разработкой статистических моделей и алгоритмов машинного обучения в первую очередь для направлений Производства и Качества. В будущем планируем развивать ML практики и внедрять их в другие сферы компании.

Подробнее о том, что мы делаем:

  • Проводим explorative-анализ данных, делаем пилоты для подтверждения гипотезы о том, что можно решить поставленную заказчиком задачу с помощью ML и статистики;
  • Выявляем аномалии в time-series (отказ датчиков, нестандартные режимы работы и т.п.);
  • Пишем понятный и поддерживаемый код, делаем качественные, воспроизводимых пайплайны обучения моделей;
  • Брейнштормим и генерируем идеи всей командой.

О том как мы собираем данные для экспериментов можно почитать в нашей статье: habr.com/ru/company/biocad/blog/586124/

Наш стэк: Python, MongoDB, PostgreSQL, Apache NIFI, PySpark, MLFlow, git.

Пример проектов, над которыми сейчас работает команда:

  • Построение модели адаптивного регулятора для замены PID-регулятора;
  • Поиск аномалий в сигналах датчиков;

Некоторое представление о наших заказчиках можно получить, прочтя их статью: habr.com/ru/company/biocad/blog/564902/

Сейчас в команде 4 data scientist. Мы расширяем команду и ищем еще одного уровня middle/senior.

Задачи, которыми предстоит заниматься:

  • Погружаться в предметные области, работать с заказчиками;
  • Выполнять исследовательские задачи, искать причинно-следственные связи;
  • Проявлять инициативу, предлагать собственные гипотезы;
  • Создавать осмысленные модели;
  • Участвовать в разработке архитектуры ML сервисов;
  • Документировать и презентовать результаты работы.

Требования:

  • Наличие практических достижений в области ML;
  • Знание статистики и умение ее применять (Методы статистического вывода, проверка гипотез, statsmodels);
  • Уверенный Python, Git;
  • Опыт работы с базами данных: оконные функции, индексы, оптимизация запросов (postgres, mongo);
  • Желание разбираться в предметной области, работать с заказчиками.

Бонусы

  • Территориальное месторасположение – м. Гостиный Двор, Бутик-офис центр "Пассаж", возможность удаленной работы;
  • График работы: 5/2, с 09.30 до 18.00 (по пятницам до 17.30);
  • Конкурентоспособная заработная плата;
  • Участие в социально значимых проектах;
  • Широкие возможности для профессионального и карьерного роста.

Дополнительные инструкции

Будет плюсом:

  • Наличие опыта по выводу ML решений в prod (очень большой плюс);
  • Знакомство ETL (Airflow, NiFi) или готовность разбираться в нем;
  • MLFlow;
  • Опыт работы с Power BI;
  • Умение работать с Docker контейнерами;
  • Terminal (Linux);
  • Знание фреймворков TensorFlow/PyTorch;