Senior Data Scientist / Machine Learning Engineer с коммерческим опытом более 3х лет в крупных компаниях. Основной стек - Python, SQL , PySpark, Hadoop, DVC, Docker, Git , Jenkins, AirFlow, MLFlow, PyTorch, CatBoost, Lgbm.
Работаю с задачами кредитного скоринга, классическим ml, dl, uplift, pricing, req systems, вывод моделей в пром
Пройден курс Hard ML от Карпов
Полный цикл разработки моделей - от общения с бизнесом до вывода модели в продуктовые системы с помощью таких технологий - Jenkins , dvc , airflow , docker , ml flow, pyspark , Python.
Суммарный статистически значимый эффект от внедренных моделей более чем 1млрд.
Мои обязанности включали себя :
- полный цикл разработки модели
- мониторинг и пилотирование моделей
Пример моделей : Look-A-Like модели для выявления наиболее склонных клиентов Сбера к покупке пакета Премьер и облигаций компании для дальнейшей коммуникации (Response , uplift). Gini моделей 0.85 и 0.65 соответсвенно . Доп NPV от моделей составил приблизительно 15мл.р .
Применил новый калибровщик моделей . Это позволило улучшить конверсию продаж в среднем на 0.05% .
SQL : Teradata , GreenPlum
BigData: Spark ,Hadoop ,Hive
Communications : Gira , confluence, git
Мои обязанности :
- Полный цикл разработки различных моделей
- Общение с поставщиками данных
- Сбор и генерация данных с разных источников
- Валидация моделей (доведение модели до продакшена)
- Презентация моделей для Бизнеса(заказчика)
- Проведение code-review других разработчиков
- Анализ данных и факторов для построения моделей.
Пример задач: Модуль для стекинга - модель для предсказания дефолта компаний в 90 дней на 12 месяц, основанная на данных о заключенных контрактах с бенифициаром. Приблизительный результат Gini около 40%. Результат стекинга с другими модулями дал более 45%. Модель пошла в пром.
Sql: PostgreSQL
Communication : Git, BitBucket , Gira, Confluence
Environment: Linux bash
ML: Sk-learn, ML flow , Air flow, Logistic Regression , Pandas , Numpy