Data Scientist (ML)
Требования
Местоположение и тип занятости
Компания
Разработка в области онлайн-игровой индустрии
Описание вакансии
Условия работы
Мы в Deeplay решаем задачи игровой индустрии с использованием искусственного интеллекта и big data.
Наша продуктовая команда разрабатывает мобильное приложение для международного рынка. Для усиления наших задач мы готовы взять в команду data scientist (ML).
Задачи:
- Например, мы хотим кластеризировать пользователей. Все ж хотят =) Чуть в отличие от всех, мы хотим это делать не потому что самоцель, а потому что промежуточный шаг до аплифта: к нас есть кучка воздействий на пользователя с нативным ощущением, которое части клиентов нравится, а части как-то не очень, и хочется верить что любовь конкретного воздействия это характеристика группы игроков. Классическое желание про лучше понять клиента здесь тоже есть, но вторично и с попыткой прокачать через оцифрованный CJM.
- Ещё одна задача — матчмейкинг пользователей. Есть довольно сильная боль с разными вариантами целевой функции, из-за чего вероятно придётся пробовать довольно много вариаций одной и той же задачи.
- Кучка вещей про антифрод видна на горизонте. Сейчас мы успешно решаем это через большое количество экспертного кода, но хочется повысить градус автоматизации и по возможности размечать нехороших людей на самом начале их плохого жизненного пути, до того момента, когда они уже нанесли вред и мы поняли, как именно они обманывают систему.
Бонусы
Условия:
- Минимум ентерпрайз приколов: не любим бюрократию, ценим хорошо работающие процессы и не боимся их менять;
- Команда распределена по всей России, процессы налажены сквозь часовые пояса;
- У нас есть уютные офисы в Новосибирске и Омске, ходя ходить туда и не обязательно. Чуть менее уютные есть в Питере и Москве. Куча привычных ништяков IT-офиса, конечно;
- А еще мы оплачиваем всем ребятам их обучение по профилю работы: сейчас у нас ходят на уроки английского языка, курсы по архитектуре сервисов, воркшопы по развороту highload проектов и много других курсов.
Дополнительные инструкции
Стек:
- Python как язык;
- Clickhouse как бд;
- Airflow как шедулер;
- Docker как контейнеризация.
Требования:
- Базовая университетская математика (линал + тервер);
- Python для обработки данных и data discovery. Если что, ETL прогеры сбоку есть, которые помогут прокачаться и покажут всякий хардкор. Но на начале уже надо что-то уметь;
- Всякие питонячьи либы из DS/ML стэка. pandas, sklearn, matplotlib, любое из xgboost/catboost/lgbm, etc;
- Корректно ставить эксперименты и проверять гипотезы. Типичные fallacy, как приходящие данные могут испортить вообще всё из-за того, что они про людей, всё такое;
- Работать с высокой степенью самостоятельности. Куча людей, которые умеют, отвечают на вопросы, помогут подтянуть скиллы etc есть, все добрые и с радостью помогут. Но не настолько добрые, что сами придут насильно помогать, у всех есть чем заняться =);
- Читать статьи на английском. Не то же самое, что "читать английский достаточно хорошо, чтобы понимать статьи".
Будет плюсом:
- pytorch / tensorflow;
- любое про ML на графах;
- Участие в Kaggle или аналогах;
- Pet проект или что-то ещё, условно доведённое до результата.