Senior Data Scientist NLP в команду клиентского сервиса

Местоположение и тип занятости

Москва, Санкт-Петербург, НовосибирскПолный рабочий деньМожно удаленно

Компания

Описание вакансии

О компании и команде

Центр технологий искусственного интеллекта (ЦТИИ) Газпромбанка — это команда профессионалов, которые используют AI технологии для разработки и внедрения инновационных решений. Мы сосредоточены на создании интеллектуальных систем, которые могут анализировать большие объемы данных и предоставлять ценную информацию о клиентах.

Основные проекты осуществляются по нескольким направлениям: риски, борьба с мошенничеством, персонализация, клиентский сервис и автоматизация.

Ожидания от кандидата

Мы ждем, что вы:

  • Имеете практический опыт полного цикла решения NLP задач: предобработка данных, выбор алгоритмов и тюнинг их параметров, оценка качества моделей, визуализация;
  • Занимались дообучением BERT-Like и GPT-Like моделей;
  • Работали с LLM, prompt engineering;
  • Программируете на Python, R или подобных языках, умеете писать чистый код;
  • Знаете SQL на уверенном уровне (вложенные запросы, оконные функции);
  • Работали с фреймворками PyTorch / TensorFlow;
  • Работали с Linux, bash, системами контроля версий
  • Знаете и понимаете метрики, необходимые для оценки качества генеративных моделей;
  • Имеете высшее образование в области математического моделирования/ информатики/ машинного обучения.

Будет плюсом, если вы:

  • Владеете фреймворками автоматизации процессов и оркестрации задач (например, AirFlow, Prefect, Luigi и др.);
  • Работали с системами поддержки жизненного цикла и версионирования моделей (например, MLFlow, DVC);
  • Имеете опыт написания BRD, технической документации.

Чем ты будешь заниматься?

  • Проектировать, разрабатывать и внедрять LLM модели, участвовать в разработке pipeline до промышленной реализации;
  • Создавать генеративные модели, чат-боты;
  • Проводить исследования, проверять гипотезы проекта с использованием LLM в задачах генерации обучающего контента;
  • Работать с текстовыми данными - обращениями клиентов, отзывами, чатами (NLTK, genism, word2vec, Bert, etc);
  • Анализировать различные источники данных, генерировать признаки для построения моделей;
  • Проверять гипотезы, проводить A/B тестирования, EDA;
  • Ресерчить новые подходы и технологии.

Условия работы

Что мы предлагаем:

    • Достойный уровень вознаграждения;
    • ДМС со стоматологией с первого месяца работы;
    • Отпуск 33 дня + материальная помощь к отпуску;
    • Полное соблюдение ТК РФ.