Data Scientist (ML)

Местоположение и тип занятости

Можно удаленно

Компания

Разработка в области онлайн-игровой индустрии

Описание вакансии

Условия работы

Мы в Deeplay решаем задачи игровой индустрии с использованием искусственного интеллекта и big data.
Наша продуктовая команда разрабатывает мобильное приложение для международного рынка. Для усиления наших задач мы готовы взять в команду data scientist (ML).

Задачи:

  • Например, мы хотим кластеризировать пользователей. Все ж хотят =) Чуть в отличие от всех, мы хотим это делать не потому что самоцель, а потому что промежуточный шаг до аплифта: к нас есть кучка воздействий на пользователя с нативным ощущением, которое части клиентов нравится, а части как-то не очень, и хочется верить что любовь конкретного воздействия это характеристика группы игроков. Классическое желание про лучше понять клиента здесь тоже есть, но вторично и с попыткой прокачать через оцифрованный CJM.
  • Ещё одна задача — матчмейкинг пользователей. Есть довольно сильная боль с разными вариантами целевой функции, из-за чего вероятно придётся пробовать довольно много вариаций одной и той же задачи.
  • Кучка вещей про антифрод видна на горизонте. Сейчас мы успешно решаем это через большое количество экспертного кода, но хочется повысить градус автоматизации и по возможности размечать нехороших людей на самом начале их плохого жизненного пути, до того момента, когда они уже нанесли вред и мы поняли, как именно они обманывают систему.

Бонусы

Условия:

  • Минимум ентерпрайз приколов: не любим бюрократию, ценим хорошо работающие процессы и не боимся их менять;
  • ​​​​​​​Команда распределена по всей России, процессы налажены сквозь часовые пояса;
  • У нас есть уютные офисы в Новосибирске и Омске, ходя ходить туда и не обязательно. Чуть менее уютные есть в Питере и Москве. Куча привычных ништяков IT-офиса, конечно;
  • ​​​​​​​А еще мы оплачиваем всем ребятам их обучение по профилю работы: сейчас у нас ходят на уроки английского языка, курсы по архитектуре сервисов, воркшопы по развороту highload проектов и много других курсов.

Дополнительные инструкции

Стек:​​​​​​​

  • Python как язык;
  • Clickhouse как бд;
  • Airflow как шедулер;
  • ​​​​​​​Docker как контейнеризация.

Требования:

  • Базовая университетская математика (линал + тервер);
  • Python для обработки данных и data discovery. Если что, ETL прогеры сбоку есть, которые помогут прокачаться и покажут всякий хардкор. Но на начале уже надо что-то уметь;
  • Всякие питонячьи либы из DS/ML стэка. pandas, sklearn, matplotlib, любое из xgboost/catboost/lgbm, etc;
  • ​​​​​​​Корректно ставить эксперименты и проверять гипотезы. Типичные fallacy, как приходящие данные могут испортить вообще всё из-за того, что они про людей, всё такое;
  • ​​​​​​​Работать с высокой степенью самостоятельности. Куча людей, которые умеют, отвечают на вопросы, помогут подтянуть скиллы etc есть, все добрые и с радостью помогут. Но не настолько добрые, что сами придут насильно помогать, у всех есть чем заняться =);
  • ​​​​​​​Читать статьи на английском. Не то же самое, что "читать английский достаточно хорошо, чтобы понимать статьи".

​​​Будет плюсом:

  • pytorch / tensorflow;
  • любое про ML на графах;
  • Участие в Kaggle или аналогах;
  • Pet проект или что-то ещё, условно доведённое до результата.

Смотреть ещё вакансии