Senior/middle Data Scientist
Требования
Местоположение и тип занятости
Компания
Описание вакансии
Условия работы
Наша команда занимается обучением SOTA моделей для решения задач NLP и PLP.
В NLP мы занимаемся SOTA подходами в ODQA. Пытаемся обучить диалоговые модели, которые умеют поболтать и в ODQA (like ChatGPT).
В PLP пытаемся разработчикам облегчить жизнь.Мы, совместно с командой из SberWorks, делаем плагины для сред разработки. Разработали плагин автозавершения кода для VSCode, PyCharm, IDEA . Пока сосредоточены на Python, Java, JS, но список будет расширяться. В Сбере уже более 1000 строк кода пишут наши модели. Мы целимся превзойти результаты Copilot, TabNine.
Если вы имеете амбиции добиться результатов в NLP/PLP и имеете много идей, что нового попробовать в этой области, то давайте к нам!
Что ожидаем от кандидата?
- хорошие теоретические знания в DL
- знание последних достижений в области NLP/PLP. Постоянно следите за последними пейперами
- умение формулировать эксперименты с научной строгостью, обосновывать их и проводить самостоятельно
- опыт тюна моделей на различные задачи NLP/PLP
- опыт обучения трансформеров с нуля.
- распределенное обучения моделей (horovod, torch.distibuted)
- стандартные библиотеки для DL и NLP (PyTorch, TensorFlow, Transformers)
- увлеченность NLP/PLP и DL
Дополнительно плюсом будет:
- участие в соревнованиях по ML
- сабмиты на лидербордах по NLP/PLP
- публикации
- формулирование экспериментов
- обучение моделей на кластере
- оценка качества моделей
- подготовка прототипов
- оптимизация инференса моделей
Что мы предлагаем:
- оформление по ТК РФ
- возможность работать удалённо или в офисе
- социальный пакет (ДМС)
- возможность посещения конференций, обучения и сертификации за счет компании
- Льготное кредитование и ипотека
- офис: Москва, Кутузовский 32.