Data Scientist (ML, AI, Big Data, Python)

Зарплата

от 100 000 до 150 000 ₽

Местоположение и тип занятости

МоскваПолный рабочий деньМожно удаленно

Компания

AI и "цифровые двойники" для строительства

Описание вакансии

Условия работы

Sarex - это инновационный SaaS-продукт, предназначенный для цифровизации строительства и телекома.

Дроны, робототехника, лазерное сканирование и фотограмметрия - мы используем современные технологии, чтобы помогать нашим клиентам зарабатывать больше. Мы уже сотрудничаем с такими компаниями как ГК “ПИК” и ПАО “МТС” и являемся резидентами Сколково.

Мы ищем Machine Learning разработчика для проведения экспериментов и воплощения в жизнь интересных кейсов использования ML в таких “нетрадиционных” отраслях как строительство и телеком. Вас ожидает необычное применение нейронных сетей и градиентного бустинга для решения практических задач крупного бизнеса - автоматическое распознавание дефектов на вышках сотовой связи и выявление ошибок в строительстве по 3D-моделям и BIM-моделям.

Наш идеальный кандидат

  1. Может понять и повторить результаты, описанные в статье:
    http://www.sersc.org/journals/IJCA/vol9_no7/17.pdf
  2. Хочет принимать участие во встречах с крупнейшими российскими компаниями и формировать требования к продукту
  3. Способен быстро доводить идеи до продакшена

Требования

  • Уверенное знание и опыт в машинном обучении;
  • Опыт разработки на Python;
  • Представление о sklearn, tensorflow, theano, xgboost etc.
  • Опыт взаимодействия с API;
  • Опыт работы с python-фреймворками (NumPy, Pandas, pymongo etc.);
  • Умение работать с системой контроля версий Git;

Обязанности

  • Проведение экспериментов и их последующее доведение до продакшн состояния;
  • Предобработка и очистка данных, построение признаков (feature engineering)
  • Интеграция ML-решений в существующие продукты;

Nice to have

  • Опыт участия в соревнованиях Kaggle
  • Опыт использования Python (nltk, tensorflow, pandas, numpy, scikit-learn, matplotlib)
  • Знание MATLAB / R
  • Опыт работы с большими объемами данных, использования инструментов экосистемы Hadoop (Spark, Hive, Yarn);
  • Широкий математический кругозор (теория игр, теория графов, комбинаторика, задачи мат. физики и др.), опыт моделирования разнообразных физических и экономических процессов;

Приветствуются ссылки на Github, Habrahabr, личный блог, статьи и т.д.