Data Scientist в команду Core LLM
Требования
Местоположение и тип занятости
Компания
Международный интернет-магазин одежды, обуви и товаров для дома
Описание вакансии
О компании и команде
Wildberries – это крупнейший маркетплейс России с миллионами пользователей и миллиардами оборота, работающий на рынке 19 лет.
Наша компания стабильно развивается и работает в усиленном режиме: использует современный стек и новейшие технологии, разрабатывает множество новых hi-tech продуктов.
Мы ищем Middle и Senior Data Scientists в команду Core LLM. Основная задача - приносить пользу различным продуктам внутри WB, благодаря построению переиспользуемых решений. В моменте фокусируемся на карточках товаров и работаем в связке с командами Рекомендаций, Антифрода и Поиска.
Ожидания от кандидата
- Опыт работы с LLM, prompt engineering, дообучением GPT-like моделей;
- Знание PyTorch, Numpy, Sklearn, Pandas;
- Опыт классической ML разработки одной или нескольких типов моделей: Text classification, NER, QA;
- Умение ориентироваться в алгоритмах и структурах данных;
- Опыт построения систем с использованием RAG (Retrieval-Augmented Generation) подхода и дообучения LLM на своих данных.
Что нужно делать
- Заниматься тюнингом LLM под русский язык и задачи WB;
- Исследовать архитектуру Mamba и ее применимость;
- Доучивать LLM для автоматизации тех.поддержки;
- Создавать векторные рекомендации;
- Улучшать мультиязычность;
- Решать задачи с использованием самых актуальных технологий и достижений в машинном обучении, как в науке.
Условия работы
- Интересные задачи, и исследовательские, и прикладные, возможность переключаться между ними и видеть улучшения от них в production;
- Большие данные, сотни миллионов товаров, миллиарды действий пользователей в день, ресурсы и инфраструктуру, необходимые для работы с ними;
- Инфраструктура: Мощные GPU-кластеры, петабайты данных;
- Развитие: Конференции, курсы, внутренние митапы;
- Гибридный или удаленный формат работы с гибким началом рабочего дня;
- Бесплатное питание в наших офисах;
- Скидки на фитнес и образовательные программы.