👀 Дизайнеры, какая команда подходит вам по вайбам? Проверяйте на Вайб-чеке→ vibe.habr.com

ML инженер NLP

Местоположение и тип занятости

Можно удаленно

Компания

Ведущий разработчик программного обеспечения с опытом реализации высоконагруженных систем.

Описание вакансии

Условия работы

О проекте: Цифровой ассистент портала госуслуг по имени Робот Макс. Макс полностью поменяет формат взаимодействия с госуслугами.

Вместо привычного поиска он уточнит потребность гражданина, поможет заполнить заявление или подскажет, как правильно сформулировать вопрос.

Ключевой элемент Макса, его «мозг» ядро, которое совмещает в себе кластеризацию и классификацию запросов, подбор стратегии принятия решения, персонализацию и анализ статистических показателей.

Для поиска информации применяется одновременно несколько механик с разным технологическим стеком. Задействуется нейронная сеть, семантические индексы, алгоритмизация.

Чем предстоит заниматься:

Разрабатывать и улучшать обработку текстов обращений пользователя в робота;
Выделение смысла и интентов обращений, подбор наиболее релевантных ответов;
Настройка обработки морфологии, исправления опечаток, работа с изменчивостью и специфическими для русского языка свойствами текста;
Изучать лучшие технические практики и использовать для улучшения продукта, выход на SOTA уровень работы с текстами;
Отслеживать качество моделей и эмбеддингов, улучшать и переобучать на регулярной основе;
Взаимодействовать с разработкой для встраивания моделей в продуктовый пайплайн;



    Что мы от вас ждем:

    Высшее математическое/техническое/экономическое/лингвистическое образование;
    Опыт от 1-3 года в data science или больше, опыт от года в обработке текстов; Знание матстатистики, computer science, ML и DL;
    Опыт доведения ml-моделей до продакшена и желание рассказать о них;
    Знание одного или нескольких ООП языков, используемых в машинном обучении (python/Java/Scala), уверенная работа с аналитическими пакетами (numpy, pandas, scipy), фреймворками ml и dl, знание специфичных для NLP моделей и методов (в т.ч. основанных на pytorch/tensorflow, transformers, tfidf, bm25, topic modeling, word2vec, doc2vec, bpe, conv1d и lstm для текстов);
    Представление о git, CI/CD, jira и confluence.

      Будет плюсом:

      Профильное образование, e.g. ШАД, МГУ, ВШЭ, МФТИ;
      Участие в NLP соревнованиях, сабмиты на лидербордах, участие в релевантных пет-проектах;
      Опыт в ранжировании, опыт работы с моделями в условиях ограничений по памяти/скорости инференса.

      Что мы предлагаем:

      Возможность работать полностью удаленно;
      Официальное трудоустройство по ТК РФ;
      Конкурентную заработную плату выше среднего по рынку, квартальные премии.