Senior Data Scientist / Senior Machine Learning Engineer / Senior NLP Engineer
Требования
Местоположение и тип занятости
Компания
Производство технологичных решений на стыке автомобильной и ИТ отраслей.
Описание вакансии
О компании и команде
Мы разрабатываем диалоговую систему, которая позволит водителям осуществлять покупки и заказывать товары во время вождения автомобиля с помощью разговора голосом с виртуальным ассистентом.В системе будут использованы передовые технологии распознавания и синтеза речи, понимания естественного языка на основе нейросетевых моделей типа BERT, RoBERTa,Electra, GPT, Transformer.
Основные задачи:
- Разработка моделей интент классификации, извлечения сущностей, генерации ответов с использованием LLM.
- Дообучение генеративных языковых моделей для задач диалога, суммаризации, QA.
- Исследование и применение методов оптимизации LLM - Fine-tuning, RL-агенты, RLHF, LoRA, P-Tuning.
- Разработка и тестирование диалоговых сценариев взаимодействия с пользователем.
Ожидания от кандидата
- Понимание архитектур нейронных сетей, применяемых в LLM
- Опыт разработки и внедрения моделей обработки естественного языка.
- Практический опыт и знание подходов оптимизации и дообучения LLM.
- Навыки production-grade разработки и тестирования ML систем.
- Глубокое понимание методов ML/DL, опыт работы с PyTorch, Tensorflow, sklearn.
- Умение писать качественный, поддерживаемый код.
- Быстрая проверка гипотез на результат.
- Умение чётко и ясно излагать свои мысли, как письменно, так и голосом при встречах, для понимания Вас всеми членами команды.
- Знания английского языка (чтение технической литературы).
Будет плюсом:
- Опыт работы с диалоговыми системами, оптимизацией генеративных LLM ( GPT-3, Neo-j, LLAMA, Falcon, GigaChat, RuGPT).
- Если вы работали над извлечением сущностей и интентов в Маркетплейсах:Ozon, WB, Yandex Market
- Если вы разрабатывали голосовых асссистентов Маруся, Алиса, Салют.
Условия работы
- Работа в перспективном стартапе над инновационным продуктом. В компании уже 700+ человек.
- Москва, полная занятость, гибридный график, офис в центре.
- У нас нет легаси длиной в 20 лет, весь стек разработки от 2023 года.
- Вся разработка продуктовая, на результат, а не на отчётность.