Senior/middle Data Scientist

Местоположение и тип занятости

МоскваПолный рабочий деньМожно удаленно

Компания

Крупнейшая цифровая платформа. Технобренд, объединяющий лучшие мировые практики и самый современный стек

Описание вакансии

Условия работы

Наша команда занимается обучением SOTA моделей для решения задач NLP и PLP.
В NLP мы занимаемся SOTA подходами в ODQA. Пытаемся обучить диалоговые модели, которые умеют поболтать и в ODQA (like ChatGPT).
В PLP пытаемся разработчикам облегчить жизнь.Мы, совместно с командой из SberWorks, делаем плагины для сред разработки. Разработали плагин автозавершения кода для VSCode, PyCharm, IDEA . Пока сосредоточены на Python, Java, JS, но список будет расширяться. В Сбере уже более 1000 строк кода пишут наши модели. Мы целимся превзойти результаты Copilot, TabNine.
Если вы имеете амбиции добиться результатов в NLP/PLP и имеете много идей, что нового попробовать в этой области, то давайте к нам!

Что ожидаем от кандидата?

  • хорошие теоретические знания в DL
  • знание последних достижений в области NLP/PLP. Постоянно следите за последними пейперами
  • умение формулировать эксперименты с научной строгостью, обосновывать их и проводить самостоятельно
  • опыт тюна моделей на различные задачи NLP/PLP
  • опыт обучения трансформеров с нуля.
  • распределенное обучения моделей (horovod, torch.distibuted)
  • стандартные библиотеки для DL и NLP (PyTorch, TensorFlow, Transformers)
  • увлеченность NLP/PLP и DL

Дополнительно плюсом будет:

  • участие в соревнованиях по ML
  • сабмиты на лидербордах по NLP/PLP
  • публикации
  • формулирование экспериментов
  • обучение моделей на кластере
  • оценка качества моделей
  • подготовка прототипов
  • оптимизация инференса моделей

Что мы предлагаем:

  • оформление по ТК РФ
  • возможность работать удалённо или в офисе
  • социальный пакет (ДМС)
  • возможность посещения конференций, обучения и сертификации за счет компании
  • Льготное кредитование и ипотека
  • офис: Москва, Кутузовский 32.