🔥 1000+ вакансий с удаленкой на Хабр Карьере → посмотреть и откликнуться

Data scientist (NLP)

Местоположение и тип занятости

МоскваПолный рабочий деньМожно удаленно

Компания

Российский универсальный коммерческий банк c государственным участием

Описание вакансии

О компании и команде

Команда "Модели оптимизации процессов" ищет коллегу в свою команду.

Мы занимаемся оптимизацией процессов в банке и дочерних компаниях, но и совершенно новые задачи тоже решаем. Основные проекты - NLP и временные ряды


Ожидания от кандидата

  • техническое образование, опыт работы DS от 2-ух лет;
  • владение стандартным набором python-библиотек для ML;
  • опыт обработки текста;
  • знание Python, Pytorch, Hadoop, SQL, PySpark;
  • умение говорить с бизнес-заказчиком на одном языке, переводить задачу с языка бизнеса в ML постановку;
  • способность самостоятельно рисерчить новые темы, читать статьи на английском и реализовывать их;
  • опыт решения time-series задач будет плюсом.

Условия работы

  • трудоустройство согласно Законодательству;
  • конкурентная заработная плата;
  •  профессиональное обучение и развитие;
  • добровольное медицинское страхование, льготные условия кредитования;
  •  корпоративная пенсионная программа, материальная помощь;
  •  спортивная жизнь и корпоративные мероприятия;
  •  возможность построить карьеру в ведущем банке России.

Обязанности:

  • участие во взаимодействии с заказчиками для уточнения деталей постановки и требований к модели, синхронизации статусов, демонстрации результатов моделирования;
  • разработка моделей ML, дообучение, оптимизация инференса под разные требования (железо, скорость работы);
  • документация моделирования, отчёты о прогрессе (ежеквартальные для демо и синхронизации с заказчиками);
  • сопровождение внедрённых моделей - если заказчик возвращается с ошибками работы, их анализ и дообучение модели.
  • Текущие и будущие задачи:
    • Анализ трафика СМС: поиск потенциальных клиентов банка, выявление интересов людей, рискованных клиентов;
    • База статей: суммаризация текста, тегирование, исправление ошибок, дописывание, кластеризация базы статей;
    • Матчинг резюме и вакансии;
    • Анализ обращений и отзывов: подбор решения, рабочей группы, выявление массовых инцидентов;
    • Аудио аналитика звонков: uplift-моделирование, подбор оператора под клиента, детекция эмоций;
    • Анализ логов ИС: кластеризация, прогнозирование, выявление аномалий (аварий);
    • Исследовательские проекты (AutoML и подобные ему проекты) совместно с научной средой (Сколтех, МФТИ, МГУ).