ML-инженер с 3-летним опытом создания и внедрения рекомендательных систем для крупных контентных платформ («Строки», «КИОН»).
Языки программирования: Python, SQL
Библиотеки: Pandas, Scikit-learn, Numpy, SciPy, Seaborn, Matplotlib, Implicit, RecTools, XGBoost, LightGBM, CatBoost
Machine Learning: RecSys, Linear regression, SVM, Logistic regression, Decision tree, Random Forest, Boosting, Clustering
Автоматизация: Airflow, Optuna, PyTest, Pylint
Big Data: PySpark, Hadoop
Инструменты: Git, GitLab, Jira, Confluence
Telegram: bulgakova_olesya
E-mail: olesyarvach@gmail.com
Github: olesyabulgakova
Лекция и семинар в Школе Аналитиков Данных от МТС по теме "Двухэтапные модели рекомендаций"
Рассказ от лица ML разработчика о рекомендательных подходах в крупном книжном сервисе экосистемы МТС
Наша команда, состоит из трех ML-разработчиков, дата-инженера и аналитика. Моя зона ответственности — разработка и внедрение RecSys.
Для создания эффективных ML моделей использую Python, библиотеки Pandas, Numpy, Scikit-learn, SciPy, CatBoost и RecTools для анализа данных и создания моделей. Работаю с большими данными, используя PySpark. Для эффективного внедрения и мониторинга ML моделей в производственные системы применяю MLOps-подходы, чтобы выбирать наиболее эффективные решения провожу A/B-тесты. Для автоматизации процессов использую Airflow, а для оптимизации и тестирования моделей — Optuna и PyTest.
Книжный сервис «Строки»:
Рекомендательная платформа:
Библиотека RecTools:
Школа Аналитиков Данных МТС:
Рекомендательная система для онлайн-кинотеатра «КИОН»:
Средний балл диплома: 8.1 (диплом с отличием)
Тема диплома: Разработка рекомендательной системы для аудиокниг в онлайн библиотеке