Data Scientist (ML, AI, Big Data, Python)
Зарплата
Требования
Местоположение и тип занятости
Компания
Описание вакансии
Условия работы
Sarex - это инновационный SaaS-продукт, предназначенный для цифровизации строительства и телекома.
Дроны, робототехника, лазерное сканирование и фотограмметрия - мы используем современные технологии, чтобы помогать нашим клиентам зарабатывать больше. Мы уже сотрудничаем с такими компаниями как ГК “ПИК” и ПАО “МТС” и являемся резидентами Сколково.
Мы ищем Machine Learning разработчика для проведения экспериментов и воплощения в жизнь интересных кейсов использования ML в таких “нетрадиционных” отраслях как строительство и телеком. Вас ожидает необычное применение нейронных сетей и градиентного бустинга для решения практических задач крупного бизнеса - автоматическое распознавание дефектов на вышках сотовой связи и выявление ошибок в строительстве по 3D-моделям и BIM-моделям.
Наш идеальный кандидат
- Может понять и повторить результаты, описанные в статье:
http://www.sersc.org/journals/IJCA/vol9_no7/17.pdf - Хочет принимать участие во встречах с крупнейшими российскими компаниями и формировать требования к продукту
- Способен быстро доводить идеи до продакшена
Требования
- Уверенное знание и опыт в машинном обучении;
- Опыт разработки на Python;
- Представление о sklearn, tensorflow, theano, xgboost etc.
- Опыт взаимодействия с API;
- Опыт работы с python-фреймворками (NumPy, Pandas, pymongo etc.);
- Умение работать с системой контроля версий Git;
Обязанности
- Проведение экспериментов и их последующее доведение до продакшн состояния;
- Предобработка и очистка данных, построение признаков (feature engineering)
- Интеграция ML-решений в существующие продукты;
Nice to have
- Опыт участия в соревнованиях Kaggle
- Опыт использования Python (nltk, tensorflow, pandas, numpy, scikit-learn, matplotlib)
- Знание MATLAB / R
- Опыт работы с большими объемами данных, использования инструментов экосистемы Hadoop (Spark, Hive, Yarn);
- Широкий математический кругозор (теория игр, теория графов, комбинаторика, задачи мат. физики и др.), опыт моделирования разнообразных физических и экономических процессов;
Приветствуются ссылки на Github, Habrahabr, личный блог, статьи и т.д.