Data scientist (ML)

Зарплата

от 70 000 до 110 000 ₽

Местоположение и тип занятости

НовосибирскПолный рабочий деньМожно удаленно

Компания

Разработка в области онлайн-игровой индустрии

Описание вакансии

Условия работы

Привет!

Deeplay это команда разработчиков, дизайнеров, архитекторов инфраструктуры.

Основное направление нашей работы - разработка технологий управления игровыми алгоритмами для улучшения пользовательского опыта и результатов в торговле, игровой и мобильной индустриях.

Мы усиливаем команду и ищем Junior data scientist

У нас есть задачи:

  • Уже есть некоторое количество ML моделек, они работают хорошо, а иногда даже великолепно. Их точно надо поддерживать, то есть реагировать при каких-то ломающих изменениях во входящих данных и чинить вещи, которые не были готовы к такой подлости от мира. Иногда их надо развивать, чтобы результат чаще оказывался на стороне великолепно. А иногда — поднимать похожие клоны моделей на соседних потоках данных, которые вроде бы похожи, но вот не то чтобы совсем.
  • Результаты моделей надо матчить в полученную пользу. Это не значит, что над душой стоят люди с серьёзными лицами и вопросом "сколько рублей эта машинерия принесла нам за последний час". Но это значит, что после того, как команда повысила r2 с 0.85 до 0.92, надо ещё показать, что это улучшило бизнес-задачу. Вообще здорово будет показать это до того, как приступать к повышению r2. В этом конечно будут помогать и продакт, и аналитики, и вообще все вокруг. Но работы именно от MLщика здесь обычно больше всего.
  • Надо делать новые модельки. Конечно, не в одиночку, а в команде с сеньорами, позиция джуновская всё же =) С нас тут минимизация работы в стол: задачи приходят уже достаточно прожёванные, итерации на fast fail, всё такое.

Есть мнение про что нужно уметь, чтобы эти задачи хорошо делать:

  • Базовая университетская математика (линал + тервер).
  • Python для обработки данных и data discovery. Если что, ETL прогеры сбоку есть, которые помогут прокачаться и покажут всякий хардкор. Но на начале уже надо что-то уметь.
  • Всякие питонячьи либы из DS/ML стэка. pandas, sklearn, matplotlib, любое из xgboost/catboost/lgbm, etc.
  • Корректно ставить эксперименты и проверять гипотезы. Типичные fallacy, как приходящие данные могут испортить вообще всё из-за того, что они про людей, всё такое.
  • Визуализировать данные. Мегаверстку и игры с цветами не обязательно, но банальные вопросы типа "зачем подписывать оси, кто тут такой тупой что не поймёт, что по Ox время" хочется пропустить.
  • Работать с высокой степенью самостоятельности. Куча людей, которые умеют, отвечают на вопросы, помогут подтянуть скиллы etc есть, все добрые и с радостью помогут. Но не настолько добрые, что сами придут насильно помогать, у всех есть чем заняться =)
  • Хотя бы терпеть новые технологии и методы. У нас есть несколько архитекторов на энерджайзерах, которые умеют набежать и поставить 4 новые инфраструктурные приблуды за неделю времени. Иногда мы их даже сами специально зовём. Если это вызывает дикую боль, будет сложновато.
  • Читать статьи на английском. Не то же самое, что "читать английский достаточно хорошо, чтобы понимать статьи".

Сильно упростит диалог, если ты сможешь показать:

  • Какой-то код на github, за который не стыдно. Код, за который стыдно, это не минус, но только предупреди пожалуйста, что за него стыдно =)
  • Pet проект или что-то ещё, условно доведённое до результата.
  • Участие в Kaggle или аналогах

Плюсы, которые не готовы писать в требования, но о них полезно упомянуть:

  • pytorch / tensorflow
  • любое про ML на графах

Основной стек, вдруг это кому-то интересно:

  • Python как язык
  • Clickhouse как бд
  • Airflow как шедулер
  • Docker как контейнерезация

Есть ещё очень много вещей помельче, и всегда готовы что-то добавить, когда надо или хотя бы хочется.

Плюшки:

  • Минимум ентерпрайз приколов: не любим бюрократию, ценим хорошо работающие процессы и не боимся их менять.
  • Можно работать откуда угодно и когда угодно. Просто предупреди того, кому важно поработать одновременно с тобой.
  • У нас есть уютный офис в Новосибирске, ходя ходить туда и не обязательно. Куча привычных ништяков IT офиса, конечно.
  • А еще мы оплачиваем всем ребятам их обучение по профилю работы: сейчас у нас ходят на уроки английского языка, курсы по архитектуре сервисов, воркшопы по развороту highload проектов и много других курсов.