Data scientist (ML)
Зарплата
Требования
Местоположение и тип занятости
Компания
Описание вакансии
Условия работы
Привет!
Deeplay это команда разработчиков, дизайнеров, архитекторов инфраструктуры.
Основное направление нашей работы - разработка технологий управления игровыми алгоритмами для улучшения пользовательского опыта и результатов в торговле, игровой и мобильной индустриях.
Мы усиливаем команду и ищем Junior data scientist
У нас есть задачи:
- Уже есть некоторое количество ML моделек, они работают хорошо, а иногда даже великолепно. Их точно надо поддерживать, то есть реагировать при каких-то ломающих изменениях во входящих данных и чинить вещи, которые не были готовы к такой подлости от мира. Иногда их надо развивать, чтобы результат чаще оказывался на стороне великолепно. А иногда — поднимать похожие клоны моделей на соседних потоках данных, которые вроде бы похожи, но вот не то чтобы совсем.
- Результаты моделей надо матчить в полученную пользу. Это не значит, что над душой стоят люди с серьёзными лицами и вопросом "сколько рублей эта машинерия принесла нам за последний час". Но это значит, что после того, как команда повысила r2 с 0.85 до 0.92, надо ещё показать, что это улучшило бизнес-задачу. Вообще здорово будет показать это до того, как приступать к повышению r2. В этом конечно будут помогать и продакт, и аналитики, и вообще все вокруг. Но работы именно от MLщика здесь обычно больше всего.
- Надо делать новые модельки. Конечно, не в одиночку, а в команде с сеньорами, позиция джуновская всё же =) С нас тут минимизация работы в стол: задачи приходят уже достаточно прожёванные, итерации на fast fail, всё такое.
Есть мнение про что нужно уметь, чтобы эти задачи хорошо делать:
- Базовая университетская математика (линал + тервер).
- Python для обработки данных и data discovery. Если что, ETL прогеры сбоку есть, которые помогут прокачаться и покажут всякий хардкор. Но на начале уже надо что-то уметь.
- Всякие питонячьи либы из DS/ML стэка. pandas, sklearn, matplotlib, любое из xgboost/catboost/lgbm, etc.
- Корректно ставить эксперименты и проверять гипотезы. Типичные fallacy, как приходящие данные могут испортить вообще всё из-за того, что они про людей, всё такое.
- Визуализировать данные. Мегаверстку и игры с цветами не обязательно, но банальные вопросы типа "зачем подписывать оси, кто тут такой тупой что не поймёт, что по Ox время" хочется пропустить.
- Работать с высокой степенью самостоятельности. Куча людей, которые умеют, отвечают на вопросы, помогут подтянуть скиллы etc есть, все добрые и с радостью помогут. Но не настолько добрые, что сами придут насильно помогать, у всех есть чем заняться =)
- Хотя бы терпеть новые технологии и методы. У нас есть несколько архитекторов на энерджайзерах, которые умеют набежать и поставить 4 новые инфраструктурные приблуды за неделю времени. Иногда мы их даже сами специально зовём. Если это вызывает дикую боль, будет сложновато.
- Читать статьи на английском. Не то же самое, что "читать английский достаточно хорошо, чтобы понимать статьи".
Сильно упростит диалог, если ты сможешь показать:
- Какой-то код на github, за который не стыдно. Код, за который стыдно, это не минус, но только предупреди пожалуйста, что за него стыдно =)
- Pet проект или что-то ещё, условно доведённое до результата.
- Участие в Kaggle или аналогах
Плюсы, которые не готовы писать в требования, но о них полезно упомянуть:
- pytorch / tensorflow
- любое про ML на графах
Основной стек, вдруг это кому-то интересно:
- Python как язык
- Clickhouse как бд
- Airflow как шедулер
- Docker как контейнерезация
Есть ещё очень много вещей помельче, и всегда готовы что-то добавить, когда надо или хотя бы хочется.
Плюшки:
- Минимум ентерпрайз приколов: не любим бюрократию, ценим хорошо работающие процессы и не боимся их менять.
- Можно работать откуда угодно и когда угодно. Просто предупреди того, кому важно поработать одновременно с тобой.
- У нас есть уютный офис в Новосибирске, ходя ходить туда и не обязательно. Куча привычных ништяков IT офиса, конечно.
- А еще мы оплачиваем всем ребятам их обучение по профилю работы: сейчас у нас ходят на уроки английского языка, курсы по архитектуре сервисов, воркшопы по развороту highload проектов и много других курсов.