Middle/Senior NLP-специалист
Требования
Местоположение и тип занятости
Компания
Все организации города, их контакты, адреса, время работы + трехмерная карта + маршруты проезда
Описание вакансии
Условия работы
Привет!
Мы расширяем NLP-команду 2ГИС и ищем несколько дата-сайентистов уровня middle или senior.
Задачи:
- У нас два больших проекта — товары/услуги в продукте и user generated content.
- В товарах занимаемся дедупликацией товаров между различными компаниями, нормализацией, извлечением характеристик товаров, классификацией, модерацией, обнаружением аномалий и самим поиском по товарам. Подробнее о решаемых задачах можно посмотреть в докладе и на VC.
- В UGC-задачах — извлечение аспектов из отзывов компаний (aspect extraction и aspect sentiment classification), модерация отзывов, суммаризация (задача multi-document summarization).
- Есть ещё и прикладные исследования — adversarial attacks для дополнительного тестирования моделей, интерпретируемость моделей, confidence models.
Стек:
Пишем на pytorch и иногда на tensorflow, делаем юнит-тесты, используем CI, Jenkins, Git, мёрж-реквесты и ревью — всё, что нужно для командной работы.
Требования:
- Опыт работы с PyTorch и/или TensorFlow + NumPy, sklearn.
- Хорошее знание Python.
- Знание инструментов разработки и CI/CD — Git, Jenkins, GitLab, Jira.
- Опыт работы над NLP-задачами от двух лет.
- Знание современных архитектур и моделей — рекуррентные и свёрточные сети, современные языковые модели (BERT, BART и т. п.). А также классических методов —классические языковые модели, tf-idf, Skip-gram, CBoW, CRF, FSTs, HMM.
- Опыт использования библиотек — allennlp, kenlm, transformers, nltk, pyonmttok, vowpalwabbit, gensim и т.п.
Будет плюсом опыт участия в соревнованиях по машинному обучению (Kaggle/Boosters.pro и т.п.).
Условия
- Белая зарплата и ДМС
- Удобный для тебя график работы
- Удалённая работа
- Или комфортные офисы в Новосибирске (помогаем с релокацией)
- Техника и ОС — на твой выбор (для удалёнки — доставим и поможем настроить)