Data Scientist / Аналитик Data Science
Зарплата
Требования
Местоположение и тип занятости
Компания
Описание вакансии
Условия работы
Добрый день!
Группа компаний "Форексис", основана в 2000 году группой преподавателей и выпускников МФТИ и МГУ на базе Вычислительного Центра Российской академии наук (сейчас ФИЦ "Информатика и управление" РАН). Является ведущим разработчиком и вендором универсальных Al- решений, на IT-рынке. Автор таких систем как «Антиплагиат», используемой для проверки всех квалификационных и выпускных работ в России, системы «САФРАН», используемой для поиска мошенников на финансовых рынках страны, системы «Гудфокаст», используемой во многих крупных организациях, в том числе иностранных, и множества других интересных проектов.
«ПроКомплаенс»– инновационная российская компания, резидент ИТ-кластера фонда «Сколково», входящая в группу компаний «Форексис», разработала систему мониторинга Check4Trick, обеспечивающую анализ торгов по историческим данным с целью выявления нарушений и потенциальных фактов манипулирования финансовыми рынками. Позволяет анализировать ход торгов за заданный период по ряду критериев, а также производит диагностику отклонений с помощью настраиваемых критериев и набора формируемых на их основании сценариев. У нас более 20 клиентов, в том числе Московская биржа, Российская финансовая группа ВТБ, независимая инвестиционная группа АТОН и многие другие крупнейшие профессиональные участники российского биржевого рынка.
Мы ищем человека, которому будет интересно решать исследовательские задачи из различных областей, таких как Time Series Classification/Forecasting, Fraud Detection, NLP и других.
В связи с увеличением штата мы ищем в команду опытных Data Scientist на различные проекты, ниже пример некоторых из них:
Мониторинг финансовых рынков и финансовых потоков, выявление событий, связанных с «мошенническими» схемами / неправомерными практиками
- задачи обработки естественного языка, в частности, классификации и разметки текстов (NER, NEL, NED, NERD, …);
- задачи обнаружения «аномалий» в финансовых потоках и во временных рядах показателей рынка;
- оценивание, прогнозирование динамики связей с использованием алгоритмов на графах, генерация значимых графовых признаков;
- классификация транзакционных действий с учётом текстовой информации и данных рынка.
Анализ изображений и видео в задаче выявления дефектов деталей
- сегментация изображений в различных постановках (как по каждому пикселю, так и по BoundingBox);
- анализ и обработка сегментированного изображения;
- классификация изображений по степени дефекта (возможны различные подходы, как классические подходы с генерацией признаков из пиксельной информации, так и современные нейросетевые методы классификации)
Классификация сообщений новостного потока, связанного с фондовыми рынками и распознавание в тексте ключевой информации
- задачи обработки естественного языка, в частности, задачи классификации сообщений по типам, содержащихся в них корпоративных событий, и разметки ключевой информации в тексте (NER, NEL, NED, NERD …);
- тематическое моделирование новостного потока;
- промышленное внедрение языковых моделей;
- автоматизация адаптации модели с использованием ActiveLearning;
- мультиязыковые модели и связывание NE на различных языках.
Skills: Natural Language Processing (в частности NER, NEL, NERD), Topic Model, Time Series Classification/Forecasting and anomaly detection, Graph algorithms, Computer Vision
Пожелания к вашему опыту:
- Опыт работы: от 2-х лет- обязательно!
- Опыт решения задач из области Time Series Classification/Forecasting.
- Знание стандартных алгоритмов и структур данных поиска и хранения информации.
- Знание теории вероятностей, математической статистики и базовых методов оптимизации.
- Знание методов анализа временных рядов и опыт работы с ними.
- Опыт построения композиционных моделей машинного обучения, включающих нейросети.
- Знание Python\R и умение пользоваться пакетами с Machine Learning инструментарием.
- Опыт разработки используемого на данный момент кода в рамках решения задачи анализа данных.
Будет преимуществом:
- Образование - высшее техническое (не ниже бакалавра).
- Выпускники ведущих вузов - МФТИ, МГУ, ВШЭ и др- желательно.
- Знание иностранных языков - Английский, чтение научных статей.
- Участие в научно-исследовательских проектах.
Мы предлагаем:
- Оформление по ТК РФ (оплата отпуска, больничных листов и т.д.)
- График работы Full-time, гибкое начало рабочего дня.
- Современный, новый офис в самом центе- в шаговой доступности от м. Киевская (кольцевая)
- Возможен частично удаленный формат работы.
- Дружный коллектив, интересные задачи, возможность профессионального роста.
- Возможность быстрого наращивания компетенций.
- Забота о сотрудниках: готовы компенсировать обучение и сертификацию.
- Свобода развития, гибкий подход к процессам, интересные проекты.
- Дружелюбная атмосфера и сильная команда.
- В компании внедрена системы адаптации для каждого нового сотрудника, позволяющая максимально комфортно и быстро влиться в коллектив и работу.
- Уровень оплаты обсуждается индивидуально по итогам интервью.
- Перспектива роста – Руководитель отдела Data Science.