Data Engineer/ ML Ops/ Разработчик DWH
Зарплата
Требования
Местоположение и тип занятости
Компания
Описание вакансии
Условия работы
Цельс с 2017 года решает множество интересных задач в области анализа медицинских изображений. Наши решения уже внедрены в клиническую практику. Нам приходится работать с огромным количеством медицинских данных разнообразного свойства. У нас накопился большой спектр задач, где нужно экспертное решение по сбору, анализу и приложению в работу данных из разных команд: аналитиков, разработчиков, специалистов по компьютерному зрению. В этой связи мы приглашаем опытного, активного и неравнодушного Инженера данных.
Примеры текущих задач:
- Создание и поддержка дата-платформы - БД, ETL-пайплайны, разработка и поддержка дата-продуктов
- Поддержка БД с разметкой и написание проверок качества данных совместно с ML-командами
- Создание различных пайплайнов - офлайн-генерация предсказаний для неразмеченных данных; автоматическое создание заданий на разметку; синхронизация данных между разными хранилищами (Yandex.Cloud, локальное хранилище, горячие хранилища на отдельных серверах)
- Помощь в создании различных сервисов для ML-команд и команды разметки - например сервис по автоматическому отбору данных на разметку с помощью активного обучения; сервис по мониторингу экспериментов на spot-инстансах; интерактивные витрины и дашборды
- Опционально - помощь в оптимизации пайплайнов автоматического тестирования DL-систем
Мы ищем того, кто, успешно развивает продуктивные коммуникации между разноплановыми проектными коллективами
- умеет слушать чужие мнения и не стесняется высказывать своё
- готов работать в условиях не до конца сформированного, хаотичного рынка медицинских AI-технологий
- интересуется современными технологиями и фреймворками, любит делиться знаниями и отвечать на вопросы
Наши решения:
- Маммография - детектирование злокачественных и доброкачественных образований на снимках молочной железы. Мы - первая команда, прошедшая в продуктовый контур Эксперимента по использованию сервисов на основе технологий ИИ в системе здравоохранения города Москвы.
- Флюорография и рентген - классификация и сегментация патологических изменений грудной клетки
- КТ лёгких - сегментация злокачественных образований, признаков COVID-19 и пяти других патологий
- КТ мозга - локализация внутричерепных кровоизлияний
Мы предлагаем:
- Офис у метро Площадь Восстания, доступ 24/7
- ДМС
- Официальная заработная плата
- Полный рабочий день, гибкий график, возможен гибридный режим работы
- Работа в большом ML-отделе (25 человек), регулярные эвенты по обмену знаниями
- Постоянно выступаем на конфах (CodeFest, ODS Data Fest, Opentalks.AI, LeanDS)
Требования:
- Отличное владение Python
- Владение необходимым инструментарием - Docker, Docker Compose, Kubernetes
- Опыт работы с СУБД (PostgreSQL)
- Опыт работы с облачными хранилищами данных - Amazon/Yandex S3
- Опыт работы с Prometheus и Grafana
- Опыт создания интерактивных дашбордов на Python - например, Steamlit или Dash
- Опыт работы с KV-хранилищами
Плюсом будет:
- Опыт работы с ETL-инструментами - Airflow (Kubernetes Executor)
- Опыт работы с Redis, RabbitMQ, Kafka
- Знание фреймворков для сёрвинга и деплоя (BentoML, Seldon, Cortex, etc.)
- Знание фреймворков трекинга экспериментов (ClearML, DVC, MLFlow, W&B)
- Знание веб-фреймворков - Flask, FastAPI
- Знание основной ML-терминологии, опыт работы с GPU-ресурсами