С моим CV можно познакомиться по ссылке: https://disk.yandex.com/i/3s38XDtVHpux3w \\ tg: https://t.me/victorm011
Занимаюсь разработкой моделей временных рядов и внедрением NLP моделей (RAG и различные задачи языка) в документообороте для внутренних заказчиков.
Наиболее интересные области: machine learning, NLP, TimeSeries и reinforcement learning.
Master's GPA - 8.3/10. Тема магистерской диссертации: Forecasting ESG ETFs Stock Prices Using Transformer-Based Models (прим.: фокус на исследование предсказательной способности моделей для нестационарных временных рядов и проведение экспериментов, в том числе с разработанными исследовательской группой моделями, учитывающими спектральные характеристики сигнала).
Пройденные курсы во время магистратуры, относящиеся к полю интересов: машинное обучение, глубокое обучение (в особенности для Time Series, NLP и RL), структуры данных и алгоритмов для баз данных, data mining, стохастическое моделирование, случайные процессы, математическая статистика, эконометрика-2, анализ временных рядов (все курсы были пройдены на отлично).
Люблю активный образ жизни, испанский язык и оборачивать решения задач математики в полезные для человека решения. Кроме того, ассистирую курсы по ML и Python в School of Quants.
Stack:
Python (numpy, pandas, pytorch, scipy, sklearn, pycharm, tensorflow, catboost, xgboost, lightgbm, beautifulsoup, selenium, plotly, matplotlib, seaborn etc.)
R (tidyverse, shiny, plotly, lme4, car, MASS, RSiena, deaR etc.)
SQL (ClickHouse, PostgreSQL, MySQL)
SPSS / STATA
Git / GitHub
Docker
Linux (ssh, shell, bash)
HDFS (Hadoop, Spark)
Apache Airflow / MLflow
LaTeX
• Разработка ПО для вейвлет-частотного анализа и разработка transformer-based моделей для time series prediction (Python, Matlab, C++).
• Разработка кода и документации для патентов на ПО (1 пантент зарегистрирован и 1 в процессе регистрации).
• Проведение и контроль экспериментов на вычислительном кластере "cHARISMa" (linux, ssh).
• Подготовка материалов (методологии, результатов) для статей (2 имеют статус препринта в журналах“Financial Review” (Q1) и "Экономика и математические методы").
• Разработка и обучение моделей прогноза заболеваемости и контроля за лекарствами, анализ данных в организации медицины (эконометрические методы, классическое машинное обучение и глубокое обучение в Python и R).
• Разработка и оптимизация моделей естественного языка: разговорные, вопрос-ответы, seq2seq, классификация и семантический анализ (LLM, transformers, peft, adapters, LoRA).
• Разработка и интеграция пайплайнов CI/CD (Docker, GitHub, Airflow, MLflow, linux).
• Подготовка эмпирических разделов в научных статьях, посвященных здравоохранению, эпидемиологии.
• Проведение образовательных лекций и семинаров для сотрудников по математической статистике и анализу данных, создание курса для докторантов и аспирантов в медицине.
• Аналитика и обзор методологических эконометрических статей
• Разработка методологии мониторинга уровня доходов населения в условиях экономических шоков
• Разработка пайплайнов для автоматизации обработки данных и отчетности (PyCharm, Apache Airflow)
• Преподготовка опросных данных (R, Python, SPSS)
• Аналитика данных (R, Python)
• Формирование исследовательских отчётов
• Проверка работ
• Проведение консультаций и помощь студентам по курсам теории вероятности и математической статистики
• Сбор электоральных и специфических страновых данных (особенности гос. устройства, экономических характеристик и т.д.) с помощью веб-скрапинга Python
• Обработка и анализ данных с помощью MS Excel, R, Python (получение и сравнение метрик из научной литературы, подготовка графиков)
• Работа с научной литературой
• Подготовка докладов (MS PowerPoint) и публикаций по результатам работы в электоральных бюллетенях №3 и 5 (https://cfi.hse.ru/lrps/elb)
- Магистр, Стохастическое моделирование в экономике и финансах.
- GPA: 8.3/10.0.
- Тема магистерской диссертации: Forecasting ESG ETFs Stock Prices Using Transformer-Based Models (9.0/10.0).
- Курсы: машинное обучение, глубокое обучение (в особенности NLP и RL), структуры данных и алгоритмовдля баз данных, data mining, стохастическое моделирование, случайные процессы, математическая статистика, эконометрика-2, анализ временных рядов.