ML инженер NLP
Требования
Местоположение и тип занятости
Компания
Описание вакансии
Условия работы
О проекте: Цифровой ассистент портала госуслуг по имени Робот Макс. Макс полностью поменяет формат взаимодействия с госуслугами.
Вместо привычного поиска он уточнит потребность гражданина, поможет заполнить заявление или подскажет, как правильно сформулировать вопрос.
Ключевой элемент Макса, его «мозг» ядро, которое совмещает в себе кластеризацию и классификацию запросов, подбор стратегии принятия решения, персонализацию и анализ статистических показателей.
Для поиска информации применяется одновременно несколько механик с разным технологическим стеком. Задействуется нейронная сеть, семантические индексы, алгоритмизация.
Чем предстоит заниматься:
Разрабатывать и улучшать обработку текстов обращений пользователя в робота;
Выделение смысла и интентов обращений, подбор наиболее релевантных ответов;
Настройка обработки морфологии, исправления опечаток, работа с изменчивостью и специфическими для русского языка свойствами текста;
Изучать лучшие технические практики и использовать для улучшения продукта, выход на SOTA уровень работы с текстами;
Отслеживать качество моделей и эмбеддингов, улучшать и переобучать на регулярной основе;
Взаимодействовать с разработкой для встраивания моделей в продуктовый пайплайн;
Что мы от вас ждем:
Высшее математическое/техническое/экономическое/лингвистическое образование;
Опыт от 1-3 года в data science или больше, опыт от года в обработке текстов; Знание матстатистики, computer science, ML и DL;
Опыт доведения ml-моделей до продакшена и желание рассказать о них;
Знание одного или нескольких ООП языков, используемых в машинном обучении (python/Java/Scala), уверенная работа с аналитическими пакетами (numpy, pandas, scipy), фреймворками ml и dl, знание специфичных для NLP моделей и методов (в т.ч. основанных на pytorch/tensorflow, transformers, tfidf, bm25, topic modeling, word2vec, doc2vec, bpe, conv1d и lstm для текстов);
Представление о git, CI/CD, jira и confluence.
Будет плюсом:
Профильное образование, e.g. ШАД, МГУ, ВШЭ, МФТИ;
Участие в NLP соревнованиях, сабмиты на лидербордах, участие в релевантных пет-проектах;
Опыт в ранжировании, опыт работы с моделями в условиях ограничений по памяти/скорости инференса.
Что мы предлагаем:
Возможность работать полностью удаленно;
Официальное трудоустройство по ТК РФ;
Конкурентную заработную плату выше среднего по рынку, квартальные премии.