Data Scientist

Местоположение и тип занятости

Санкт-ПетербургПолный рабочий деньМожно удаленно

Компания

Инновационная биотехнологическая компания полного цикла

Описание вакансии

Условия работы

Мы, 

Отдел мониторинга и анализа данных,
занимаемся разработкой статистических моделей и алгоритмов машинного обучения в первую очередь для направлений Производства и Качества. В будущем планируем развивать ML практики и внедрять их в другие сферы компании. Сейчас в команде 4 Data Scientists. Мы расширяем команду и ищем еще одного специалиста уровня middle/senior.

Подробнее о том, что мы делаем:

  • Проводим explorative-анализ данных, делаем пилоты для подтверждения гипотезы о том, что можно решить поставленную заказчиком задачу с помощью ML и статистики;
  • Выявляем аномалии в time-series (отказ датчиков, нестандартные режимы работы и т.п.);
  • Пишем понятный и поддерживаемый код, делаем качественные, воспроизводимых пайплайны обучения моделей;
  • Брейнштормим и генерируем идеи всей командой.

О том как мы собираем данные для экспериментов можно почитать в нашей статье: habr.com/ru/company/biocad/blog/586124/

Наш стэк: Python, MongoDB, PostgreSQL, Apache NIFI, PySpark, MLFlow, git.

Пример проектов, над которыми сейчас работает команда:

  • Построение модели адаптивного регулятора для замены PID-регулятора;
  • Поиск аномалий в сигналах датчиков;

Некоторое представление о наших заказчиках можно получить, прочтя их статью: habr.com/ru/company/biocad/blog/564902/

Тебе предстоит:

  • Погружаться в предметные области, работать с заказчиками;
  • Выполнять исследовательские задачи, искать причинно-следственные связи;
  • Проявлять инициативу, предлагать собственные гипотезы;
  • Создавать осмысленные модели;
  • Участвовать в разработке архитектуры ML сервисов;
  • Документировать и презентовать результаты работы.

Требования:

  • Наличие практических достижений в области ML;
  • Знание статистики и умение ее применять (Методы статистического вывода, проверка гипотез, statsmodels);
  • Уверенный Python, Git;
  • Опыт работы с базами данных: оконные функции, индексы, оптимизация запросов (postgres, mongo);
  • Желание разбираться в предметной области, работать с заказчиками.

Будет плюсом:

  • Наличие опыта по выводу ML решений в prod (очень большой плюс);
  • Знакомство ETL (Airflow, NiFi) или готовность разбираться в нем;
  • MLFlow;
  • Опыт работы с Power BI;
  • Умение работать с Docker контейнерами;
  • Terminal (Linux);
  • Знание фреймворков TensorFlow/PyTorch.

Бонусы

  • Достойный уровень оплаты труда, годовое премирование, официальное оформление по ТК РФ;
  • Комфортные условия: можно работать удаленно или в современном стильном офисе БЦ "Пассаж" у м. Гостиный двор в Санкт-Петербурге или в БЦ "Северная башня" в Москве, сокращенный рабочий день в пятницу;
  • Экспертная команда, возможность самостоятельного построения процессов и глубокого погружения в бизнес, высокий темп работы и возможность применять современные технологии и инструменты;
  • Забота о сотрудниках: ДМС со стоматологией после испытательного срока, внутренняя программа поддержки здоровья и благополучия сотрудников B-WELL, программы помощи сотрудникам в трудных жизненных ситуациях; программа корпоративных скидок Best Benefits (спорт, отдых, рестораны, обучение и не только);
  • Широкий спектр для обучения и развития: у нас есть внутренний корпоративный университет, корпоративная онлайн-библиотека Alpina Digital, внешние обучения и конференции, возможность обучения английскому языку в формате софинансирования; возможность участия в волонтерских программах.