🎂 Экосистеме Хабра — 19 лет!

Исследуйте все эпохи IT в игре-музее ко дню рождения. Соберите 19 артефактов, получите звание Архивариуса Хабра 19000 и участвуйте в розыгрыше мерча от компаний, которые делают будущее вместе с вами.

Поздравить нас → 19.habr.com

Middle+ / Senior NLP Engineer в Cloud ML

Местоположение и тип занятости

МоскваПолный рабочий деньМожно удаленно

Компания

Международный интернет-магазин одежды, обуви и товаров для дома

Описание вакансии

О компании и команде

Wildberries – это крупнейший маркетплейс России с миллионами пользователей и миллиардами оборота, работающий на рынке уже 20 лет.

Наша компания стабильно развивается и работает в усиленном режиме: использует современный стек и новейшие технологии, разрабатывает множество новых hi-tech продуктов.

Мы ищем Middle+ / Senior NLP Engineers в команду Cloud ML на проект Автопереводов. Основная задача - перевод динамического контента. В моменте фокусируемся на обеспечении и улучшении коммуникации продавец-покупатель, локализуем карточки товаров, переводим UI и многое другое на различные языки.

Ожидания от кандидата

  • Опыт работы в роли NLP Engineer с похожими задачами от 2 лет;
  • Опыт работы с LLM, prompt engineering, fine-tuning, дообучением GPT-like моделей;
  • Знание PyTorch, Numpy, Sklearn, Pandas;
  • Опыт классической ML разработки одной или нескольких типов моделей: Text classification, NER, QA;
  • Умение ориентироваться в алгоритмах и структурах данных;
  • Образование по физ-мат специальности будет плюсом.

Что нужно делать

  • Адаптировать и улучшать LLM модели для задачи автоперевода;
  • Заниматься fine-tuning LLM;
  • Проводить эксперименты и ресерчить новые подходы;
  • Локализовать текстовые и картиночные данные;
  • Работать над улучшением способов измерения качества переводов.

Условия работы

  • Интересные задачи, и исследовательские, и прикладные, возможность переключаться между ними и видеть улучшения от них в production;
  • Большие данные, сотни миллионов товаров, миллиарды действий пользователей в день, ресурсы и инфраструктуру, необходимые для работы с ними;
  • Инфраструктура: Мощные GPU-кластеры, петабайты данных;
  • Развитие: Конференции, курсы, внутренние митапы;
  • Гибридный или удаленный формат работы с гибким началом рабочего дня;
  • Бесплатное питание в наших офисах;
  • Скидки на фитнес и образовательные программы.