Data Scientist (NLP)
Требования
Местоположение и тип занятости
Компания
Описание вакансии
Условия работы
Мы ищем NLP Data Scientist (middle) с опытом разработки DS | ML продуктов в сфере NLP.
Кто мы:
Мы работаем в корпоративно-инвестиционном блоке, который отвечает за работу с бизнесом. Наша команда занимается обработкой естественного языка и извлечением знаний из неструктурированных источников. Мы делаем решения для бизнеса и помогаем коллегам, работающим с клиентами. Среди наших решений есть как внутренние, так и те, которые мы выводим на внешний рынок. Команда распределена между Москвой и Санкт-Петербургом и сейчас мы в поиске data scientist в команду в Санкт-Петербурге.
Как мы видим успешного кандидата.
Сотрудник команды, который обладает опытом в NLP, а также готов предлагать новые идеи, проверять гипотезы и внедрять новые подходы в работу. У нашей команды наработан большой практический опыт, так что на каждом этапе пути у вас будут опытные коллеги, которые могут оказать поддержку. В свою очередь, мы ожидаем, что вы внесёте свой вклад в развитие команды и направления.
Задачи, которые перед нами стоят, не имеют готовых решений и включают R&D составляющую. Мы уделяем особое внимание исследованиям, активно развиваем технологии искусственного интеллекта в области извлечения знаний. Присоединившись к нашей команде, вы сможете поработать с командой профессионалов, коллегами из Лаборатории Искусственного Интеллекта Сбербанка, а также преподавателями университетов США.
Инфраструктура:
У нас есть лабораторный кластер c GPU, где довольно много возможностей, данных и различного программного обеспечения. В основном наш стек - это Spark 2.x, Hive, Python 3.x, Scala. Также есть возможность работать на локальных машинах с расширенным количеством оперативной памяти и GPU. Кроме того, сотрудникам доступны ресурсы суперкомпьютера Кристофари – самого мощного компьютера в России и одного из лучших в мире.
Немного цифр:
Более 80% корпоративного рынка РФ в нашем поле зрения. Из них более 2 млн компаний являются нашими клиентами и генерируют более 1 млрд транзакций ежедневно. 100 Терабайт памяти и ~7200 ядер CPU в песочницах для работы DS.
Чем предстоит заниматься:
Команда работает по принципам Agile. Ваши задачи будут связаны с разработкой ML алгоритмов для обработки естественного языка. Новый коллега войдёт в уже существующую команду и будет заниматься созданием новых и развитием текущих моделей извлечения знаний из неструктурированных текстов. Мы ожидаем, что вы будете вовлечены во весь цикл создания решения: от проверки бизнес-гипотез до построения модели и сопровождения внедрения в пром. Задачи будут включать подготовку данных, формирование признаков, построение ML моделей, создание прототипов промышленных продуктов на базе разработанных моделей, демонстрацию результатов бизнес-заказчикам.
Что мы ожидаем от кандидатов:
· Знание алгоритмов и библиотек ML (стек: pandas, sklearn, numpy, scipy)
· Опыт работы с нейросетями (tensorflow / pytorch )
· Знание алгоритмов и опыт работы с NLP (стек: transformers, natasha, pymorphy, gensim)
· Опыт работы с Git;
· Знание SQL;
· Открытость и инициативность, желание развиваться;
Преимуществами будут:
· Опыт внедрения ML решений в бизнес процессы;
· Опыт работы с Hadoop stack;
· Spark, Scala для разработки ETL;
· Уверенное знание ООП;
Бонусы
Мы предлагаем:
- Обучение за счёт банка (на внутренних и внешних программах);
- Участие в конференциях для DS и разработчиков;
- Участие в Митапах и DS Community банка;
- Бесплатный фитнес-зал с душевыми кабинами;
- Офис у ст. м. Нарвская;
- ДМС, страхование от несчастных случаев, социальные гарантии.