🍉 Присоединяйтесь к яркому летнему Вайб-чеку

Для компаний, которые хотят найти не просто подходящих специалистов, а «своих по вайбу»

Подробности, условия и цены тут →

Computer Vision engineer в команду Поиск по фото

Требования

Инженер по компьютерному зрению
Senior
SQL
Python

Условия

Можно удалённо
Москва

Компания

Международная технологическая компания, лидер рынков e‑commerce и наружной рекламы в России

Описание вакансии

О компании и команде

Wildberries – это крупнейший маркетплейс России с миллионами пользователей и миллиардными оборотами, работающий на рынке уже 19 лет. Наша компания стабильно развивается, внедряя передовые SOTA-решения в существующие продукты и активно разрабатывая новые.

Команда Поиска по фото занимается созданием и развитием рекомендательной ленты «Похожие по фото» и сервиса «Поиск по фото». Мы разрабатываем интеллектуальные алгоритмы обработки изображений, повышая качество поиска и персонализации контента на платформе.

Работа нашей команды напрямую влияет на ключевые бизнес-показатели маркетплейса, помогая миллионам пользователей ежедневно находить нужные товары быстрее и удобнее.Наша цель — использовать современные технологии компьютерного зрения и машинного обучения, чтобы сделать поиск и рекомендации еще более точными, персонализированными и удобными.

Ожидания от кандидата

  • Опыт работы с нейросетями для обработки изображений и мультимодальными данными - VIT, CLIP, SigLip, Gemma, Qwen, BGE, YOLO;
  • Знание принципов векторных баз данных и работы с ними;
  • Умение оборачивать ML-решения в продовые пайплайны (Docker, Airflow);
  • Понимание базовых алгоритмов и структур данных;
  • Опыт работы с classic ML, включая рекомендательные системы;
  • Опыт работы с разметкой данных и созданием эффективных датасетов;
  • Понимание архитектуры поисковых систем и работы с крупными массивами изображений;
  • Знание инструментов для анализa качества ML-моделей будет плюсом.

Что нужно делать

  • Разрабатывать и обучать модели детекции для выделения главных объектов на изображениях;
  • Обучать эмбеддинговые модели для распознавания и извлечения мета-информации из изображений;
  • Использовать подходы CLIP-like и metric-learning для повышения качества поиска;
  • Обучать модели для генерации текстовых тегов по изображениям и для уточнения фотопоиска текстом;
  • Решать задачи классификации и OCR (распознавание текста);
  • Обучать классические ML-модели для ранжирования результатов поиска;
  • Создавать датасеты и разрабатывать инструкции для команд разметки;
  • Масштабировать решение на большой объем данных;
  • Подготавливать модели к продакшену с многомиллионной аудиторией.

Условия работы

  • Интересные задачи, и исследовательские, и прикладные, возможность переключаться между ними и видеть улучшения от них в production;
  • Большие данные, сотни миллионов товаров, миллиарды действий пользователей в день, ресурсы и инфраструктуру, необходимые для работы с ними;
  • Инфраструктура: Мощные GPU-кластеры, петабайты данных;
  • Развитие: Конференции, курсы, внутренние митапы;
  • Гибридный или удаленный формат работы с гибким началом рабочего дня;
  • Бесплатное питание в наших офисах;
  • Скидки на фитнес и образовательные программы.