Разработчик (NLP)
Зарплата
от 100 000 до 150 000 ₽
Требования
Местоположение и тип занятости
Компания
Крупнейшая телекоммуникационная и ведущая ИТ-компания
Описание вакансии
Условия работы
Наше подразделение решает проблему комплексного взаимодействия человека с техническими системами на естественном языке. Это означает, что пользователь уже сейчас может общаться с сервисами МТС посредством чата с автоматической диалоговой системой, которая понимает его запросы и на основе них формирует наиболее релевантный ответ на естественном для человека языке.
Обязанности
- Предобработка текстов.
- Классификация, кластеризация текстов.
- Извлечение именованных сущностей и ключевых слов.
- Морфологический, синтаксический анализ.
- Выявление интентов.
- Тематическое моделирование.
- Проверка правописания.
- Информационный поиск и обнаружение дубликатов.
- Дистрибутивная семантика: word2vec/paragraph2vec, fasttext, и др.
Требования:
- Язык программирования python.
- Опыт работы с алгоритмами и библиотеками машинного обучения в NLP (с некоторыми из представленных): nltk, Stanford NLP toolset(parser, NER, coreference resolution, word segmenter e.t.c.) spacy, genism и bigartm.
- Опыт работы с русским языком:
- морфология: pymystem3, pymorphy2
- парсеры грамматик: Tomita parser, yargy
- синтаксис: udpipe и\или syntax net и другие. - Опыт построения глубоких нейронных сетей с использованием фреймворков Tensorflow, Keras, PyTorch.
- Контроль версий: git.
- OS: Linux.
Бонусы
- офис рядом с м.Технопарк;
- бонусы дважды в год;
- ДМС + стоматология, страхование жизни, страхование при поездках за рубеж, скидки на автострахование.
- Корпоративный тариф мобильной связи (бесплатные пакеты).
- Гибкий график, отличные коллеги.
- Мы сделали обучение доступным. Вы можете проходить тренинги очно, дистанционно, в Корпоративном университете, у провайдеров, у наставников.
- Корпоративная библиотека + подписка на журналы.
- Частичная компенсация фитнесс-абонемента.
- Отпуск 31 день.
Дополнительные инструкции
Будет плюсом:
- Опыт построения моделей с использованием оптимальных эмбеддингов, памяти и внимания.
- Опыт работы с ipavlov и alennlp; понимание особенностей русского языка.
- Опыт тестирования и отладки методов/концептов обработки текстовых данных, работа с разметкой Universal Dependencies и аналогичными.
- Разработка диалоговых систем.