Data Scientist
Требования
Местоположение и тип занятости
Компания
Описание вакансии
Условия работы
Мы ищем Data Scientist’а, который готов взять на себя комплексную задачу и качественно довести её до результата. Сотруднику предстоит отвечать за аналитическую часть и прототипирование.
Команда занимается анализом транзакционных данных, финансовых и разнообразных внешних данных. Есть возможность заниматься задачами по анализу тестов.
У Сбербанка есть ряд особенностей:
· Возможность поработать с действительно богатыми и интересными данными (у нас очень много клиентов по всей России).
· Возможность быть частью быстрорастущего DS сообщества Сбербанка.
· Возможность писать на современном стеке (Python + Spark) и проникнуться всеми нюансами работы в большой технологической компании.
Предстоят следующие задачи:
- Построение различных дескриптивных моделей
- Построение ранжирующих моделей по клиентам
- Прогнозирование событий во время всего жизненного цикла клиентов в банке
- Прогнозирование временных рядов
- Рекомендательные системы для сотрудников Банка
Обязанности:
- Участие в постановке задачи и ее бизнес применения
- Построение, разработка и поддержка моделей машинного обучения (Python + Spark и тд)
- Построение аналитических отчетов по результатам проведенной работы
- Обеспечение четкого и подробного документирования результатов моделирования для передачи на автоматизацию
Основные требования:
- Опыт работы в области Data science от года;
- Знание SQL - простые запросы, Join`ы, агрегаты, группировки, вложенные запросы;
- Знание python: стандартные структуры данных (dict, list, set, модуль collections), pandas, numpy, h5py;
- Знакомство с форматами данных: сsv и разновидности, json, yaml, parquet, orc;
- Знакомство с bash: базовые комманды для работы с файлами и процессами (cd, cp, mv, ls, rm, grep, head, tail, tr, du, df, free, top, ps, kill, locate) - нужно для работы на кластере;
- Опыт работы с Hadoop (Hive, Spark, HBase) является плюсом
Моделирование:
- Feature Enginering: - методы оценки значимости и отбора признаков, методы уменьшения размерности, приемы работы с текстом;
- Model - различать основные классы задач (регрессия, классификация, кластеризация) и уметь формулировать бизнес-задачу в их терминах. Знать основные методы и знать api по их использованию; Знать методы работы с временными рядами;
- Python - sklearn, numpy, scipy, xgboost (в порядке убывания приоритета)
Evaluation:
- Различать методы оценки качества модели под основные классы задач и понимать плюсы и минусы их применения. (f1, precision, recall, roc auc, mse, rmse, silhouette..)
- Инструменты для организации и автоматизации работы: GridSearch, pipelines, ide, git, Jira
Бонусы
Мы предлагаем:
- Команда профессионалов, готовых поддержать ваши инициативы;
- Мощное железо, дополнительные мониторы и всё, что нужно для продуктивной работы;
- Возможность работы с новыми технологиями;
- Обучение за счёт компании;
- Гибкий график (гибкое начало рабочего дня);
- Красивый и комфортный офис рядом с метро.
- ДМС;
- Прозрачная система бонусов и премий, достойная зарплата — размер обсудим на собеседовании.