С моим CV можно познакомиться по ссылке: https://disk.yandex.com/i/gs9v596lBc3FxQ \\ tg: https://t.me/victorm011
Занимаюсь разработкой моделей временных рядов и внедрением NLP моделей (RAG и различные задачи языка) в документообороте для внутренних заказчиков.
Наиболее интересные области: machine learning, NLP, TimeSeries и reinforcement learning.
Master's GPA - 8.3/10. Тема магистерской диссертации: Forecasting ESG ETFs Stock Prices Using Transformer-Based Models (прим.: фокус на исследование предсказательной способности моделей для нестационарных временных рядов и проведение экспериментов, в том числе с разработанными исследовательской группой моделями, учитывающими спектральные характеристики сигнала).
Пройденные курсы во время магистратуры, относящиеся к полю интересов: машинное обучение, глубокое обучение (в особенности для Time Series, NLP и RL), структуры данных и алгоритмов для баз данных, data mining, стохастическое моделирование, случайные процессы, математическая статистика, эконометрика-2, анализ временных рядов (все курсы были пройдены на отлично).
Люблю активный образ жизни, испанский язык и оборачивать решения задач математики в полезные для человека решения. Кроме того, ассистирую курсы по ML и Python в School of Quants.
Stack
- Python (PyTorch, sklearn, numpy, scipy, spacy, XGBoost, Catboost, LightGBM, NLTK, etc.)
- БД. SQL: ClickHouse, PostgreSQL. Векторные: Milvus, Opensearch
- FAISS, LLamaIndex, LangChain
- VCS (Git / GitHub / GitLab)
- Docker, k8s
- Linux (ssh, shell, bash)
- Prod: ONNX, Nvidia Triton, TensorRT
- Hadoop: (HDFS, Hive, PySpark, Airflow)
- Exp control: MLflow, Grafana, Prometheus
- LaTeX
- ООП
- FastAPI
- Main domains: NLP, time series forecasting, RL, stochastic processes
- Stat langs: R, SPSS / STATA
• Разработка ПО для вейвлет-частотного анализа и разработка transformer-based моделей для time series prediction (Python, Matlab, C++).
• Разработка кода и документации для патентов на ПО (1 пантент зарегистрирован и 1 в процессе регистрации).
• Проведение и контроль экспериментов на вычислительном кластере "cHARISMa" (linux, ssh).
• Подготовка материалов (методологии, результатов) для статей (2 имеют статус препринта в журналах“Financial Review” (Q1) и "Экономика и математические методы").
• Разработка и обучение моделей прогноза заболеваемости и контроля за лекарствами, A/B тестирование в социологии медицины.
• Разработка и оптимизация RAG систем: алгоритмы поиска, ранжирования, классификации, question answering, NLU, NLI (LLM, transformers, peft, adapters, LoRA).
• Разработка и интеграция пайплайнов CI/CD (Docker, GitLab, Airflow, MLflow, linux, ONNX, Nvidia Triton).
• Подготовка эмпирических разделов в научных статьях, посвященных здравоохранению, эпидемиологии.
• Проведение образовательных лекций и семинаров для сотрудников по математической статистике и анализу данных, создание курса для докторантов и аспирантов в медицине.
• Аналитика и обзор методологических эконометрических статей
• Разработка методологии мониторинга уровня доходов населения в условиях экономических шоков
• Разработка пайплайнов для автоматизации обработки данных и отчетности (PyCharm, Apache Airflow)
• Преподготовка опросных данных (R, Python, SPSS)
• Аналитика данных (R, Python)
• Формирование исследовательских отчётов
• Проверка работ
• Проведение консультаций и помощь студентам по курсам теории вероятности и математической статистики
• Сбор электоральных и специфических страновых данных (особенности гос. устройства, экономических характеристик и т.д.) с помощью веб-скрапинга Python
• Обработка и анализ данных с помощью MS Excel, R, Python (получение и сравнение метрик из научной литературы, подготовка графиков)
• Работа с научной литературой
• Подготовка докладов (MS PowerPoint) и публикаций по результатам работы в электоральных бюллетенях №3 и 5 (https://cfi.hse.ru/lrps/elb)
- Магистр, Стохастическое моделирование в экономике и финансах.
- GPA: 8.3/10.0.
- Тема магистерской диссертации: Forecasting ESG ETFs Stock Prices Using Transformer-Based Models (9.0/10.0).
- Курсы: машинное обучение, глубокое обучение (в особенности NLP и RL), структуры данных и алгоритмовдля баз данных, data mining, стохастическое моделирование, случайные процессы, математическая статистика, эконометрика-2, анализ временных рядов.