Middle+ Data Scientist (Audio аналитика)
Требования
Местоположение и тип занятости
Компания
Российский телеком-оператор с 50 миллионами клиентов и 30 тысячами сотрудников
Описание вакансии
О компании и команде
Всем привет. В команду аудио аналитики Beeline ищем Middle Data Scientist, который готов решать вместе с нами амбициозные задачи, связанные с анализом аудио и текстовых данных. Если ты полон идей и желания профессионально развиваться в данной области, а также участвовать во всех этапах создания крутых продуктов, то будем рады сотрудничеству. Присоединившись к нам, ты получишь почти безграничные возможности для реализации своего таланта, а вместе с ними быcтрый карьерный рост.
Ожидания от кандидата
Итак, вам предстоит:
- Проводить исследовательскую работу по поиску и реализации нейросетевых алгоритмов по направлению NLP, ASR, диаризация, анализ аудиосигналов
- Формировать датасеты и организовывать процедуры разметки
- Обучать модели и проводить оценку их качества
- Заниматься усовершенствованием пайплайнов, оптимизацией моделей и внедрением в продуктив.
Мы будем рады рассмотреть вашу кандидатуру, если у вас есть:
- Успешный профессиональный опыт решения задач в области анализа аудио и текстовых данных не менее 1 года;
- Математический бэкграунд, знание основ машинного обучения и нейронных сетей;
- Опыт построения моделей нейронных сетей с помощью фреймворка pytorch;
- Уверенные знания форматов аудио данных, а также способов их обработки на языке Python;
- Понимание подходов к обработке текстовых данных и решению NLP задач;
- Любовь к Python, ООП и структурам данных;
- Хорошие отношения с ОС Linux, Git, Docker.
Будет супер, если при тебе также имеются:
- Знание SOTA архитектур нейронных сетей, решающих задачи ASR, TTS, NER;
- Опыт использования MLFlow;
- Опыт использования Kubernetes
Условия работы
Что мы предлагаем:
- Сильную команду из топовых ВУЗов, с которой можно расти.
- Свободу в принятии решений, возможность влиять на процесс и результат.
- Развитое внутреннее DS/DA комьюнити (100+ человек) с регулярными митапами и встречами по обмену опытом.
- Ежегодный процесс-ревью.
- Десятки Пбайт разнообразных данных - от классических табличных до гео, графов, кликстримов, текстов и картинок.
- Развитая MLOps инфраструктура и процессы, мощный кластер с GPU.
- Внешнее и внутреннее обучение, участие в митапах и конференциях.
- Полис добровольного медицинского страхования, обслуживаемый в лучших клиниках.
- Корпоративные скидки на фитнес, обучение, путешествия и т.п.
- Служебную сотовую связь.