Data Scientist / Аналитик Data Science

Зарплата

от 120 000 до 250 000 ₽

Местоположение и тип занятости

Полный рабочий деньМожно удаленно

Компания

Разработчик и интегратор программных технологий в области анализа данных, прогнозирования и оптими

Описание вакансии

Условия работы

Добрый день!

Группа компаний "Форексис", основана в 2000 году группой преподавателей и выпускников МФТИ и МГУ на базе Вычислительного Центра Российской академии наук (сейчас ФИЦ "Информатика и управление" РАН). Является ведущим разработчиком и вендором универсальных Al- решений, на IT-рынке. Автор таких систем как «Антиплагиат», используемой для проверки всех квалификационных и выпускных работ в России, системы «САФРАН», используемой для поиска мошенников на финансовых рынках страны, системы «Гудфокаст», используемой во многих крупных организациях, в том числе иностранных, и множества других интересных проектов.

«ПроКомплаенс»– инновационная российская компания, резидент ИТ-кластера фонда «Сколково», входящая в группу компаний «Форексис», разработала систему мониторинга Check4Trick, обеспечивающую анализ торгов по историческим данным с целью выявления нарушений и потенциальных фактов манипулирования финансовыми рынками. Позволяет анализировать ход торгов за заданный период по ряду критериев, а также производит диагностику отклонений с помощью настраиваемых критериев и набора формируемых на их основании сценариев. У нас более 20 клиентов, в том числе Московская биржа, Российская финансовая группа ВТБ, независимая инвестиционная группа АТОН и многие другие крупнейшие профессиональные участники российского биржевого рынка.

Мы ищем человека, которому будет интересно решать исследовательские задачи из различных областей, таких как Time Series Classification/Forecasting, Fraud Detection, NLP и других.

В связи с увеличением штата мы ищем в команду опытных Data Scientist на различные проекты, ниже пример некоторых из них:

Мониторинг финансовых рынков и финансовых потоков, выявление событий, связанных с «мошенническими» схемами / неправомерными практиками

  • задачи обработки естественного языка, в частности, классификации и разметки текстов (NER, NEL, NED, NERD, …);
  • задачи обнаружения «аномалий» в финансовых потоках и во временных рядах показателей рынка;
  • оценивание, прогнозирование динамики связей с использованием алгоритмов на графах, генерация значимых графовых признаков;
  • классификация транзакционных действий с учётом текстовой информации и данных рынка.

Анализ изображений и видео в задаче выявления дефектов деталей

  • сегментация изображений в различных постановках (как по каждому пикселю, так и по BoundingBox);
  • анализ и обработка сегментированного изображения;
  • классификация изображений по степени дефекта (возможны различные подходы, как классические подходы с генерацией признаков из пиксельной информации, так и современные нейросетевые методы классификации)

Классификация сообщений новостного потока, связанного с фондовыми рынками и распознавание в тексте ключевой информации

  • задачи обработки естественного языка, в частности, задачи классификации сообщений по типам, содержащихся в них корпоративных событий, и разметки ключевой информации в тексте (NER, NEL, NED, NERD …);
  • тематическое моделирование новостного потока;
  • промышленное внедрение языковых моделей;
  • автоматизация адаптации модели с использованием ActiveLearning;
  • мультиязыковые модели и связывание NE на различных языках.

Skills: Natural Language Processing (в частности NER, NEL, NERD), Topic Model, Time Series Classification/Forecasting and anomaly detection, Graph algorithms, Computer Vision

Пожелания к вашему опыту:

  • Опыт работы: от 2-х лет- обязательно!
  • Опыт решения задач из области Time Series Classification/Forecasting.
  • Знание стандартных алгоритмов и структур данных поиска и хранения информации.
  • Знание теории вероятностей, математической статистики и базовых методов оптимизации.
  • Знание методов анализа временных рядов и опыт работы с ними.
  • Опыт построения композиционных моделей машинного обучения, включающих нейросети.
  • Знание Python\R и умение пользоваться пакетами с Machine Learning инструментарием.
  • Опыт разработки используемого на данный момент кода в рамках решения задачи анализа данных.

Будет преимуществом:

  • Образование - высшее техническое (не ниже бакалавра).
  • Выпускники ведущих вузов - МФТИ, МГУ, ВШЭ и др- желательно.
  • Знание иностранных языков - Английский, чтение научных статей.
  • Участие в научно-исследовательских проектах.

Мы предлагаем:

  • Оформление по ТК РФ (оплата отпуска, больничных листов и т.д.)
  • График работы Full-time, гибкое начало рабочего дня.
  • Современный, новый офис в самом центе- в шаговой доступности от м. Киевская (кольцевая)
  • Возможен частично удаленный формат работы.
  • Дружный коллектив, интересные задачи, возможность профессионального роста.
  • Возможность быстрого наращивания компетенций.
  • Забота о сотрудниках: готовы компенсировать обучение и сертификацию.
  • Свобода развития, гибкий подход к процессам, интересные проекты.
  • Дружелюбная атмосфера и сильная команда.
  • В компании внедрена системы адаптации для каждого нового сотрудника, позволяющая максимально комфортно и быстро влиться в коллектив и работу.
  • Уровень оплаты обсуждается индивидуально по итогам интервью.
  • Перспектива роста – Руководитель отдела Data Science.