Технические навыки:
- Языки программирования: Python (pandas, NumPy, SciPy).
- Машинное обучение: Scikit-learn, XGBoost, LightGBM, Optuna, ALS.
- Анализ временных рядов: TimeSeriesSplit, лаги, скользящие средние, автокорреляция.
- Глубокое обучение: PyTorch.
- Визуализация данных: Matplotlib, Seaborn.
- Управление экспериментами: MLflow, Docker.
- CI/CD: GitLab CI.
Софт-скиллы:
- Коммуникабельность: Эффективное участие в обсуждениях, умение задавать уточняющие вопросы для улучшения командной работы.
- Адаптивность: Быстрая обучаемость и способность находить решения в условиях неопределённости, что позволяет гибко адаптировать модели и устранять ошибки.
- Внимание к деталям: Тщательная проверка кода и аналитических выводов, что обеспечивает высокое качество моделей и интерпретации данных.
---
Проекты
- Kaggle-проект по прогнозированию цен на жильё.
- Разработана регрессионная модель на основе XGBoost и Scikit-learn.
- Оптимизация гиперпараметров через RandomizedSearchCV позволила снизить RMSE на 10%.
- Проведён детальный анализ признаков, включая корреляцию, и обработка пропущенных данных.
Store Sales - Time Series Forecasting
- Kaggle-проект по прогнозированию продаж с использованием временных рядов.
- Полноценное end-to-end решение: обработка данных, создание признаков, обучение модели и прогнозирование.
- Реализована инженерия временных признаков: лаги, скользящие средние, сезонность.
- Оптимизация модели XGBoost через Optuna снизила RMSLE на 15%.
- Интеграция MLflow и GitLab CI для автоматизации экспериментов и деплоя.
- Итог: место в топ-450 участников на Kaggle.
- Проект по разработке рекомендательной системы на основе датасета MovieLens-100K.
- Использование гибридной модели на основе алгоритма ALS и LightGBM для генерации рекомендаций и кластеризации пользователей.
- Проведён анализ поведения пользователей и визуализация полученных данных.
- Оптимизация параметров модели привела к увеличению точности предсказаний.
Работа над проектами по машинному обучению и анализу данных на GitHub, с акцентом на задачи регрессии и временных рядов.