C вероятностью 99% - Data Scientist. Легко дообучаюсь на новых данных. В целях предотвращения переобучения использую YouTube, маленький теннис и йогу. Исповедую data-driven подход к принятию решений. Хейтеры скажут - джун! Но мама говорит, что я крепкий middle.
Without jokes: Мотивированный специалист в области DS/ML с опытом коммерческой разработки, проведения ad-hoc исследований и ведения проектов на основе данных в области прикладной экономики, фондовых рынков, риск-менеджмента и геоаналитики.
Proud of:
О компании:
ООО "Бюро информационных технологий" - IT-компания, разрабатывающая аналитические сервисы, дашборды и другие программные продукты на базе собственной аналитической BI-платформы "Управление в пространстве".
Должностные обязанности:
Data Science
Коммерческая разработка моделей на проектах в составе DS-команды + самостоятельное ведение проектов в рамках пресейл-активностей.
Участие в разработке архитектуры плагина для анализа данных и моделирования.
Развитие и поддержка полного цикла разработки DS/ML-продукта - от постановки задачи, подготовки и анализа данных до выведения моделей в production. Разработка моделей, обладающих бизнес-ценностью.
Погружение и курирование младших специалистов.
Основные достижения:
Разработка моделей для прогнозирования поломок на буровых установках. Решение увеличило точность прогнозирования на 14%.
Разработка нейросети для прогнозирования пиковых часов энергопотребления. Реализация механизма дообучения на поступающих данных. Выкатка моделей в полноценный production при помощи docker, flask и docker compose. Решение повысило точность прогнозирования: прирост от 5% до 34% по отдельным регионам.
Должностные обязанности:
Data Science
Развитие и поддержка полного цикла разработки DS/ML-продукта - от постановки задачи, подготовки и анализа данных до выведения моделей в production. Разработка моделей, обладающих бизнес-ценностью.
Геоаналитика
Обработка естественного языка и геокодирование адресов. Пространственная аналитика. Размещение объектов на карте и работа с геометрическими типами данных. Кластеризация объектов в пространстве (DBSCAN). Визуализация прогноза моделей на карте.
Бизнес и системная аналитика
Сбор и формализация требований. Подготовка ТЗ. Формирование постановок задач. Трекинг исполнения задач и валидация результатов. Формирование технической документации. Общение с заказчиком.
Основные достижения:
Самостоятельная реализация пресейл-проекта по прогнозированию рисков для управления МЧС по Пермскому краю от сбора и формализации требований до деплоя моделей и фронта. Система интегрирования моделей в платформу была придумана с нуля и стала основой для нового плагина. Разработанное решение повысило точность прогнозирования рисков baseline-подхода на ~ 30%.
Проведение исследований в области риск-менеджмента
Моделирование рыночных и кредитных рисков: анализ портфельного риска (акции, облигации), хеджирование, измерение чувствительности к риск-факторам, VaR и ES валидация, анализ маржинальных и форвардных PD, экспозиции к риску, дискриминационной способности рейтинга (CAP, ROC, AUC, AR or Gini coef.), дискретное и непрерывное моделирование долгосрочной вероятности дефолта, а также моделирование портфельного кредитного риска и анализ корреляции дефолтов
Подробнее: https://github.com/olesyamba/Risk_analysis
Проведение исследования в области временных рядов о нефинансовых драйверах стоимости акций индекса NASDAQ-100
Моделирование векторной авторегрессии между котировками акций: kNN импьютация, анализ стационарности и сезонности временных рядов, моделирование (G)ARCH, VECM, VAR, анализ и тестирование гипотез о наличии автокорреляции и коинтеграции, анализ остатков, анализ устойчивости результатов и определение продолжительности присутствия эффекта
Подробнее: https://github.com/olesyamba/Time_series_nasdaq-project
Проведение исследования в области фондовых рынков с применением эконометрического анализа и машинного обучения
Моделирование влияния реляционного капитала на рыночную стоимость high-tech компаний из индекса NASDAQ-100
Пули задач:
Подробнее: https://github.com/olesyamba/ICvsML
Проведение исследования в области теории игр и математического моделирования.
Моделирование поведенческого эффекта при принятии решений в условиях неопределенности: теоретико-игровое и математическое моделирование, стохастический анализ, максимизация функции полезности
Обучалась по направлению "Экономика" и специализации "Бизнес-аналитика и прикладная экономика". Закончила обучение с красным дипломом и GPA: 8.26
Дополнительно в течение 2 из 4 лет проходила обучение по направлению "Менеджмент" в качестве minor-специализации.
Time series analysis in R:
Stationarity check, Seasonality modeling, AR(I)MA, ARCH, GARCH, VAR, VECM, Cointegration check, Robust check, IRF
Intermediate Python programming for data science
Certifications: https://drive.google.com/drive/folders/16_D8i4Xc6FBWWFIcK01_PNXFPKH0LsJZ?usp=share_link
Intermediate R programming:
For instance, diff ways of importing, joining and cleaning data, various data manipulations with dplyr, data visualization with ggplot2
Certifications: https://drive.google.com/drive/folders/1wfJCN_CG3UckDCnd6iDlET-fvx27QBJi?usp=share_link
Information and achievements: https://drive.google.com/drive/u/0/folders/17GJ_kO1mw4cYsS_2ALElSjU7TwQ8Uxf5