📚 Пора стать профи в аналитике

Выбирайте курсы со скидками до 60% и получите мощный набор навыков и инструментов

раздел Курсы и обучение

Data Scientist (NLP)

Местоположение и тип занятости

Санкт-ПетербургПолный рабочий день

Компания

Крупнейшая цифровая платформа. Технобренд, объединяющий лучшие мировые практики и самый современный стек

Описание вакансии

Условия работы

Мы ищем NLP Data Scientist (middle) с опытом разработки DS | ML продуктов в сфере NLP.

Кто мы:

Мы работаем в корпоративно-инвестиционном блоке, который отвечает за работу с бизнесом. Наша команда занимается обработкой естественного языка и извлечением знаний из неструктурированных источников. Мы делаем решения для бизнеса и помогаем коллегам, работающим с клиентами. Среди наших решений есть как внутренние, так и те, которые мы выводим на внешний рынок. Команда распределена между Москвой и Санкт-Петербургом и сейчас мы в поиске data scientist в команду в Санкт-Петербурге.

Как мы видим успешного кандидата.

Сотрудник команды, который обладает опытом в NLP, а также готов предлагать новые идеи, проверять гипотезы и внедрять новые подходы в работу. У нашей команды наработан большой практический опыт, так что на каждом этапе пути у вас будут опытные коллеги, которые могут оказать поддержку. В свою очередь, мы ожидаем, что вы внесёте свой вклад в развитие команды и направления.

Задачи, которые перед нами стоят, не имеют готовых решений и включают R&D составляющую. Мы уделяем особое внимание исследованиям, активно развиваем технологии искусственного интеллекта в области извлечения знаний. Присоединившись к нашей команде, вы сможете поработать с командой профессионалов, коллегами из Лаборатории Искусственного Интеллекта Сбербанка, а также преподавателями университетов США.

Инфраструктура:

У нас есть лабораторный кластер c GPU, где довольно много возможностей, данных и различного программного обеспечения. В основном наш стек - это Spark 2.x, Hive, Python 3.x, Scala. Также есть возможность работать на локальных машинах с расширенным количеством оперативной памяти и GPU. Кроме того, сотрудникам доступны ресурсы суперкомпьютера Кристофари – самого мощного компьютера в России и одного из лучших в мире.

Немного цифр:

Более 80% корпоративного рынка РФ в нашем поле зрения. Из них более 2 млн компаний являются нашими клиентами и генерируют более 1 млрд транзакций ежедневно. 100 Терабайт памяти и ~7200 ядер CPU в песочницах для работы DS.

Чем предстоит заниматься:

Команда работает по принципам Agile. Ваши задачи будут связаны с разработкой ML алгоритмов для обработки естественного языка. Новый коллега войдёт в уже существующую команду и будет заниматься созданием новых и развитием текущих моделей извлечения знаний из неструктурированных текстов. Мы ожидаем, что вы будете вовлечены во весь цикл создания решения: от проверки бизнес-гипотез до построения модели и сопровождения внедрения в пром. Задачи будут включать подготовку данных, формирование признаков, построение ML моделей, создание прототипов промышленных продуктов на базе разработанных моделей, демонстрацию результатов бизнес-заказчикам.

Что мы ожидаем от кандидатов:

· Знание алгоритмов и библиотек ML (стек: pandas, sklearn, numpy, scipy)

· Опыт работы с нейросетями (tensorflow / pytorch )

· Знание алгоритмов и опыт работы с NLP (стек: transformers, natasha, pymorphy, gensim)

· Опыт работы с Git;

· Знание SQL;

· Открытость и инициативность, желание развиваться;

Преимуществами будут:

· Опыт внедрения ML решений в бизнес процессы;

· Опыт работы с Hadoop stack;

· Spark, Scala для разработки ETL;

· Уверенное знание ООП;

Бонусы

Мы предлагаем:

  • Обучение за счёт банка (на внутренних и внешних программах);
  • Участие в конференциях для DS и разработчиков;
  • Участие в Митапах и DS Community банка;
  • Бесплатный фитнес-зал с душевыми кабинами;
  • Офис у ст. м. Нарвская;
  • ДМС, страхование от несчастных случаев, социальные гарантии.