ML инженер NLP

24 ноября 2021

Требования

Десктоп разработчик • Базы данных • Git • SQL • Linux • Python

Местоположение и тип занятости

• Можно удаленно

Компания

Элоконт

Ведущий разработчик программного обеспечения с опытом реализации высоконагруженных систем.

Описание вакансии

Условия работы

О проекте: Цифровой ассистент портала госуслуг по имени Робот Макс. Макс полностью поменяет формат взаимодействия с госуслугами.

Вместо привычного поиска он уточнит потребность гражданина, поможет заполнить заявление или подскажет, как правильно сформулировать вопрос.

Ключевой элемент Макса, его «мозг» ядро, которое совмещает в себе кластеризацию и классификацию запросов, подбор стратегии принятия решения, персонализацию и анализ статистических показателей.

Для поиска информации применяется одновременно несколько механик с разным технологическим стеком. Задействуется нейронная сеть, семантические индексы, алгоритмизация.

Чем предстоит заниматься:

Разрабатывать и улучшать обработку текстов обращений пользователя в робота;
Выделение смысла и интентов обращений, подбор наиболее релевантных ответов;
Настройка обработки морфологии, исправления опечаток, работа с изменчивостью и специфическими для русского языка свойствами текста;
Изучать лучшие технические практики и использовать для улучшения продукта, выход на SOTA уровень работы с текстами;
Отслеживать качество моделей и эмбеддингов, улучшать и переобучать на регулярной основе;
Взаимодействовать с разработкой для встраивания моделей в продуктовый пайплайн;

Что мы от вас ждем:

Высшее математическое/техническое/экономическое/лингвистическое образование;
Опыт от 1-3 года в data science или больше, опыт от года в обработке текстов; Знание матстатистики, computer science, ML и DL;
Опыт доведения ml-моделей до продакшена и желание рассказать о них;
Знание одного или нескольких ООП языков, используемых в машинном обучении (python/Java/Scala), уверенная работа с аналитическими пакетами (numpy, pandas, scipy), фреймворками ml и dl, знание специфичных для NLP моделей и методов (в т.ч. основанных на pytorch/tensorflow, transformers, tfidf, bm25, topic modeling, word2vec, doc2vec, bpe, conv1d и lstm для текстов);
Представление о git, CI/CD, jira и confluence.

Будет плюсом:

Профильное образование, e.g. ШАД, МГУ, ВШЭ, МФТИ;
Участие в NLP соревнованиях, сабмиты на лидербордах, участие в релевантных пет-проектах;
Опыт в ранжировании, опыт работы с моделями в условиях ограничений по памяти/скорости инференса.

Что мы предлагаем:

Возможность работать полностью удаленно;
Официальное трудоустройство по ТК РФ;
Конкурентную заработную плату выше среднего по рынку, квартальные премии.

Смотреть ещё вакансии

Администратор баз данных

104

Администратор баз данных удаленно