🎯 Здесь находят менторов в IT Хабр Эксперты

Middle+ Data Scientist (Audio аналитика)

Местоположение и тип занятости

Москва, Санкт-ПетербургПолный рабочий деньМожно удаленно

Компания

Российский телеком-оператор с 50 миллионами клиентов и 30 тысячами сотрудников

Описание вакансии

О компании и команде

Всем привет. В команду аудио аналитики Beeline ищем Middle Data Scientist, который готов решать вместе с нами амбициозные задачи, связанные с анализом аудио и текстовых данных. Если ты полон идей и желания профессионально развиваться в данной области, а также участвовать во всех этапах создания крутых продуктов, то будем рады сотрудничеству. Присоединившись к нам, ты получишь почти безграничные возможности для реализации своего таланта, а вместе с ними быcтрый карьерный рост. 

Ожидания от кандидата

Итак, вам предстоит:

  • Проводить исследовательскую работу по поиску и реализации нейросетевых алгоритмов по направлению NLP, ASR, диаризация, анализ аудиосигналов
  • Формировать датасеты и организовывать процедуры разметки
  • Обучать модели и проводить оценку их качества
  • Заниматься усовершенствованием пайплайнов, оптимизацией моделей и внедрением в продуктив.

Мы будем рады рассмотреть вашу кандидатуру, если у вас есть:

  • Успешный профессиональный опыт решения задач в области анализа аудио и текстовых данных не менее 1 года; 
  • Математический бэкграунд, знание основ машинного обучения и нейронных сетей;
  • Опыт построения моделей нейронных сетей с помощью фреймворка pytorch;
  • Уверенные знания форматов аудио данных, а также способов их обработки на языке Python;
  • Понимание подходов к обработке текстовых данных и решению NLP задач;
  • Любовь к Python, ООП и структурам данных; 
  • Хорошие отношения с ОС Linux, Git, Docker.

Будет супер, если при тебе также имеются: 

  • Знание SOTA архитектур нейронных сетей, решающих задачи ASR, TTS, NER;
  • Опыт использования MLFlow;
  • Опыт использования Kubernetes

Условия работы

Что мы предлагаем:

  • Сильную команду из топовых ВУЗов, с которой можно расти.
  • Свободу в принятии решений, возможность влиять на процесс и результат.
  • Развитое внутреннее DS/DA комьюнити (100+ человек) с регулярными митапами и встречами по обмену опытом.
  • Ежегодный процесс-ревью.
  • Десятки Пбайт разнообразных данных - от классических табличных до гео, графов, кликстримов, текстов и картинок.
  • Развитая MLOps инфраструктура и процессы, мощный кластер с GPU.
  • Внешнее и внутреннее обучение, участие в митапах и конференциях.
  • Полис добровольного медицинского страхования, обслуживаемый в лучших клиниках.
  • Корпоративные скидки на фитнес, обучение, путешествия и т.п.
  • Служебную сотовую связь.