Computer Vision engineer в команду Поиск по фото
Требования
Условия
Компания
Описание вакансии
О компании и команде
Wildberries – это крупнейший маркетплейс России с миллионами пользователей и миллиардными оборотами, работающий на рынке уже 19 лет. Наша компания стабильно развивается, внедряя передовые SOTA-решения в существующие продукты и активно разрабатывая новые.
Команда Поиска по фото занимается созданием и развитием рекомендательной ленты «Похожие по фото» и сервиса «Поиск по фото». Мы разрабатываем интеллектуальные алгоритмы обработки изображений, повышая качество поиска и персонализации контента на платформе.
Работа нашей команды напрямую влияет на ключевые бизнес-показатели маркетплейса, помогая миллионам пользователей ежедневно находить нужные товары быстрее и удобнее.Наша цель — использовать современные технологии компьютерного зрения и машинного обучения, чтобы сделать поиск и рекомендации еще более точными, персонализированными и удобными.
Ожидания от кандидата
- Опыт работы с нейросетями для обработки изображений и мультимодальными данными - VIT, CLIP, SigLip, Gemma, Qwen, BGE, YOLO;
- Знание принципов векторных баз данных и работы с ними;
- Умение оборачивать ML-решения в продовые пайплайны (Docker, Airflow);
- Понимание базовых алгоритмов и структур данных;
- Опыт работы с classic ML, включая рекомендательные системы;
- Опыт работы с разметкой данных и созданием эффективных датасетов;
- Понимание архитектуры поисковых систем и работы с крупными массивами изображений;
- Знание инструментов для анализa качества ML-моделей будет плюсом.
Что нужно делать
- Разрабатывать и обучать модели детекции для выделения главных объектов на изображениях;
- Обучать эмбеддинговые модели для распознавания и извлечения мета-информации из изображений;
- Использовать подходы CLIP-like и metric-learning для повышения качества поиска;
- Обучать модели для генерации текстовых тегов по изображениям и для уточнения фотопоиска текстом;
- Решать задачи классификации и OCR (распознавание текста);
- Обучать классические ML-модели для ранжирования результатов поиска;
- Создавать датасеты и разрабатывать инструкции для команд разметки;
- Масштабировать решение на большой объем данных;
- Подготавливать модели к продакшену с многомиллионной аудиторией.
Условия работы
- Интересные задачи, и исследовательские, и прикладные, возможность переключаться между ними и видеть улучшения от них в production;
- Большие данные, сотни миллионов товаров, миллиарды действий пользователей в день, ресурсы и инфраструктуру, необходимые для работы с ними;
- Инфраструктура: Мощные GPU-кластеры, петабайты данных;
- Развитие: Конференции, курсы, внутренние митапы;
- Гибридный или удаленный формат работы с гибким началом рабочего дня;
- Бесплатное питание в наших офисах;
- Скидки на фитнес и образовательные программы.
