Middle Data Scientist (Цифровой кредитный мониторинг)
Требования
Местоположение и тип занятости
Компания
Крупнейшая цифровая платформа. Технобренд, объединяющий лучшие мировые практики и самый современный стек
Описание вакансии
Условия работы
В дивизион Цифровой кредитный мониторинг Корпоративного блока ПАО Сбербанк требуются Data Scientistы и Data Engeneerы.
Предстоит работа в команде, где будут методологи, аналитики, разработчики и другие DS и DE.
Команда занимается анализом транзакционных данных, финансовых и разнообразных внешних данных. Есть возможность заниматься задачами по анализу тестов.
У Сбербанка есть ряд особенностей:
- Возможность поработать с действительно богатыми и интересными данными (у нас очень много клиентов по всей России).
- Возможность быть частью быстрорастущего DS сообщества Сбербанка.
- Возможность писать на современном стеке (Python + Spark) и проникнуться всеми нюансами работы в большой технологической компании.
Предстоят следующие задачи:
- Построение различных дескриптивных моделей
- Построение ранжирующих моделей по клиентам
- Прогнозирование событий во время всего жизненного цикла клиентов в банке
- Прогнозирование временных рядов
Обязанности:
- Участие в постановке задачи и ее бизнес применения
- Построение, разработка и поддержка моделей машинного обучения (Python + Spark и тд)
- Построение аналитических отчетов по результатам проведенной работы
- Обеспечение четкого и подробного документирования результатов моделирования для передачи на автоматизацию
Работа с данными:
- Знание SQL - простые запросы, Join`ы, агрегаты, группировки, вложенные запросы
- Знание python: стандартные структуры данных (dict, list, set, модуль collections), pandas, numpy, h5py;
- Знакомство с форматами данных: сsv и разновидности, json, yaml, parquet, orc;
- Опыт работы с Hadoop (Hive, Spark, HBase) является плюсом
Моделирование:
- Feature Enginering: - методы оценки значимости и отбора признаков, методы уменьшения размерности, приемы работы с текстом;
- Model - различать основные классы задач (регрессия, классификация, кластеризация) и уметь формулировать бизнес-задачу в их терминах. Знать основные методы и знать api по их использованию; Знать методы работы с временными рядами;
- Python - sklearn, numpy, scipy, xgboost
Что мы готовы предложить Вам:
- современный Agile-офис, Кутузовский 32: парковка, спортзал, зоны отдыха, приятная атмосфера
- ДМС
- крупнейшее DS&AI community - более 600 DS банка
- регулярный обмен знаниями, опытом и лучшими практиками
- возможность переиспользования кода и библиотек из централизованного репозитория
- интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний
- дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
- регулярные внутренние митапы
- доход оклад + годовая премия, обсуждается индивидуально;