Data Scientist

Местоположение и тип занятости

Санкт-ПетербургПолный рабочий день

Компания

Крупнейшая цифровая платформа. Технобренд, объединяющий лучшие мировые практики и самый современный стек

Описание вакансии

Условия работы

Мы ищем Data Scientist’а, который готов взять на себя комплексную задачу и качественно довести её до результата. Сотруднику предстоит отвечать за аналитическую часть и прототипирование.

Команда занимается анализом транзакционных данных, финансовых и разнообразных внешних данных. Есть возможность заниматься задачами по анализу тестов.

У Сбербанка есть ряд особенностей:

· Возможность поработать с действительно богатыми и интересными данными (у нас очень много клиентов по всей России).

· Возможность быть частью быстрорастущего DS сообщества Сбербанка.

· Возможность писать на современном стеке (Python + Spark) и проникнуться всеми нюансами работы в большой технологической компании.

Предстоят следующие задачи:

  • Построение различных дескриптивных моделей
  • Построение ранжирующих моделей по клиентам
  • Прогнозирование событий во время всего жизненного цикла клиентов в банке
  • Прогнозирование временных рядов
  • Рекомендательные системы для сотрудников Банка


Обязанности:

  • Участие в постановке задачи и ее бизнес применения
  • Построение, разработка и поддержка моделей машинного обучения (Python + Spark и тд)
  • Построение аналитических отчетов по результатам проведенной работы
  • Обеспечение четкого и подробного документирования результатов моделирования для передачи на автоматизацию


Основные требования:

  • Опыт работы в области Data science от года;
  • Знание SQL - простые запросы, Join`ы, агрегаты, группировки, вложенные запросы;
  • Знание python: стандартные структуры данных (dict, list, set, модуль collections), pandas, numpy, h5py;
  • Знакомство с форматами данных: сsv и разновидности, json, yaml, parquet, orc;
  • Знакомство с bash: базовые комманды для работы с файлами и процессами (cd, cp, mv, ls, rm, grep, head, tail, tr, du, df, free, top, ps, kill, locate) - нужно для работы на кластере;
  • Опыт работы с Hadoop (Hive, Spark, HBase) является плюсом

Моделирование:

  • Feature Enginering: - методы оценки значимости и отбора признаков, методы уменьшения размерности, приемы работы с текстом;
  • Model - различать основные классы задач (регрессия, классификация, кластеризация) и уметь формулировать бизнес-задачу в их терминах. Знать основные методы и знать api по их использованию; Знать методы работы с временными рядами;
  • Python - sklearn, numpy, scipy, xgboost (в порядке убывания приоритета)

Evaluation:

  • Различать методы оценки качества модели под основные классы задач и понимать плюсы и минусы их применения. (f1, precision, recall, roc auc, mse, rmse, silhouette..)
  • Инструменты для организации и автоматизации работы: GridSearch, pipelines, ide, git, Jira

Бонусы

Мы предлагаем:

  • Команда профессионалов, готовых поддержать ваши инициативы;
  • Мощное железо, дополнительные мониторы и всё, что нужно для продуктивной работы;
  • Возможность работы с новыми технологиями;
  • Обучение за счёт компании;
  • Гибкий график (гибкое начало рабочего дня);
  • Красивый и комфортный офис рядом с метро.
  • ДМС;
  • Прозрачная система бонусов и премий, достойная зарплата — размер обсудим на собеседовании.