Data Engineer/ ML Ops/ Разработчик DWH

Зарплата

от 170 000 ₽

Местоположение и тип занятости

Санкт-ПетербургПолный рабочий день

Компания

Разработка программного обеспечения на базе искусственного интеллекта для анализа медицинских исследований

Описание вакансии

Условия работы

Цельс с 2017 года решает множество интересных задач в области анализа медицинских изображений. Наши решения уже внедрены в клиническую практику. Нам приходится работать с огромным количеством медицинских данных разнообразного свойства. У нас накопился большой спектр задач, где нужно экспертное решение по сбору, анализу и приложению в работу данных из разных команд: аналитиков, разработчиков, специалистов по компьютерному зрению. В этой связи мы приглашаем опытного, активного и неравнодушного Инженера данных.

Примеры текущих задач:

  • Создание и поддержка дата-платформы - БД, ETL-пайплайны, разработка и поддержка дата-продуктов
  • Поддержка БД с разметкой и написание проверок качества данных совместно с ML-командами
  • Создание различных пайплайнов - офлайн-генерация предсказаний для неразмеченных данных; автоматическое создание заданий на разметку; синхронизация данных между разными хранилищами (Yandex.Cloud, локальное хранилище, горячие хранилища на отдельных серверах)
  • Помощь в создании различных сервисов для ML-команд и команды разметки - например сервис по автоматическому отбору данных на разметку с помощью активного обучения; сервис по мониторингу экспериментов на spot-инстансах; интерактивные витрины и дашборды
  • Опционально - помощь в оптимизации пайплайнов автоматического тестирования DL-систем

Мы ищем того, кто, успешно развивает продуктивные коммуникации между разноплановыми проектными коллективами

  • умеет слушать чужие мнения и не стесняется высказывать своё
  • готов работать в условиях не до конца сформированного, хаотичного рынка медицинских AI-технологий
  • интересуется современными технологиями и фреймворками, любит делиться знаниями и отвечать на вопросы

Наши решения:

  • Маммография - детектирование злокачественных и доброкачественных образований на снимках молочной железы. Мы - первая команда, прошедшая в продуктовый контур Эксперимента по использованию сервисов на основе технологий ИИ в системе здравоохранения города Москвы.
  • Флюорография и рентген - классификация и сегментация патологических изменений грудной клетки
  • КТ лёгких - сегментация злокачественных образований, признаков COVID-19 и пяти других патологий
  • КТ мозга - локализация внутричерепных кровоизлияний

Мы предлагаем:

  • Офис у метро Площадь Восстания, доступ 24/7
  • ДМС
  • Официальная заработная плата
  • Полный рабочий день, гибкий график, возможен гибридный режим работы
  • Работа в большом ML-отделе (25 человек), регулярные эвенты по обмену знаниями
  • Постоянно выступаем на конфах (CodeFest, ODS Data Fest, Opentalks.AI, LeanDS)

Требования:

  • Отличное владение Python
  • Владение необходимым инструментарием - Docker, Docker Compose, Kubernetes
  • Опыт работы с СУБД (PostgreSQL)
  • Опыт работы с облачными хранилищами данных - Amazon/Yandex S3
  • Опыт работы с Prometheus и Grafana
  • Опыт создания интерактивных дашбордов на Python - например, Steamlit или Dash
  • Опыт работы с KV-хранилищами

Плюсом будет:

  • Опыт работы с ETL-инструментами - Airflow (Kubernetes Executor)
  • Опыт работы с Redis, RabbitMQ, Kafka
  • Знание фреймворков для сёрвинга и деплоя (BentoML, Seldon, Cortex, etc.)
  • Знание фреймворков трекинга экспериментов (ClearML, DVC, MLFlow, W&B)
  • Знание веб-фреймворков - Flask, FastAPI
  • Знание основной ML-терминологии, опыт работы с GPU-ресурсами