Data scientist (NLP)
Требования
Местоположение и тип занятости
Компания
Российский универсальный коммерческий банк c государственным участием
Описание вакансии
О компании и команде
Команда "Модели оптимизации процессов" ищет коллегу в свою команду.
Мы занимаемся оптимизацией процессов в банке и дочерних компаниях, но и совершенно новые задачи тоже решаем. Основные проекты - NLP и временные ряды
Ожидания от кандидата
- техническое образование, опыт работы DS от 2-ух лет;
- владение стандартным набором python-библиотек для ML;
- опыт обработки текста;
- знание Python, Pytorch, Hadoop, SQL, PySpark;
- умение говорить с бизнес-заказчиком на одном языке, переводить задачу с языка бизнеса в ML постановку;
- способность самостоятельно рисерчить новые темы, читать статьи на английском и реализовывать их;
- опыт решения time-series задач будет плюсом.
Условия работы
- трудоустройство согласно Законодательству;
- конкурентная заработная плата;
- профессиональное обучение и развитие;
- добровольное медицинское страхование, льготные условия кредитования;
- корпоративная пенсионная программа, материальная помощь;
- спортивная жизнь и корпоративные мероприятия;
- возможность построить карьеру в ведущем банке России.
Обязанности:
- участие во взаимодействии с заказчиками для уточнения деталей постановки и требований к модели, синхронизации статусов, демонстрации результатов моделирования;
- разработка моделей ML, дообучение, оптимизация инференса под разные требования (железо, скорость работы);
- документация моделирования, отчёты о прогрессе (ежеквартальные для демо и синхронизации с заказчиками);
- сопровождение внедрённых моделей - если заказчик возвращается с ошибками работы, их анализ и дообучение модели.
- Текущие и будущие задачи:
- Анализ трафика СМС: поиск потенциальных клиентов банка, выявление интересов людей, рискованных клиентов;
- База статей: суммаризация текста, тегирование, исправление ошибок, дописывание, кластеризация базы статей;
- Матчинг резюме и вакансии;
- Анализ обращений и отзывов: подбор решения, рабочей группы, выявление массовых инцидентов;
- Аудио аналитика звонков: uplift-моделирование, подбор оператора под клиента, детекция эмоций;
- Анализ логов ИС: кластеризация, прогнозирование, выявление аномалий (аварий);
- Исследовательские проекты (AutoML и подобные ему проекты) совместно с научной средой (Сколтех, МФТИ, МГУ).