Технические навыки:
- Языки программирования: Python (pandas, NumPy, SciPy)
- Машинное обучение: Scikit-learn, XGBoost, LightGBM, Optuna
- Временные ряды: TimeSeriesSplit, логи, скользящие средние, автокорреляция
- Глубокое обучение: PyTorch
- Визуализация данных: Matplotlib, Seaborn
- Управление экспериментами: MLflow
- CI/CD: GitLab CI
Софт-скиллы:
- Коммуникабельность: Эффективное участие в обсуждениях и задавание уточняющих вопросов, способствующих улучшению командной работы.
- Адаптивность: Быстрая обучаемость и умение находить решения в условиях неопределенности, что помогает в гибкой настройке моделей и исправлении ошибок.
- Внимание к деталям: Внимательная проверка кода и аналитических выводов для обеспечения высокого качества моделей и интерпретации данных.
Проекты:
House Price Prediction (https://github.com/NasdormML/House_Price_Prediction)
- Kaggle проект по прогнозированию цен на жилье. Используются XGBoost и Scikit-learn для построения моделей регрессии. Проведена оптимизация гиперпараметров с использованием RandomizedSearchCV, что позволило снизить RMSE на 10%. Проект включает анализ корреляции признаков и обработку пропусков данных.
Store Sales - Time Series Forecasting (https://github.com/NasdormML/Store_Sales_Forecasting)
- Kaggle проект по прогнозированию продаж на основе временных рядов. Включает инженерные методы работы с временными признаками, такими как лаги и скользящие средние. Модель на основе XGBoost с оптимизацией гиперпараметров через Optuna позволила снизить RMSLE на 15%. Занял место в топ-450 на Kaggle.
Работа над проектами по машинному обучению и анализу данных на GitHub, с акцентом на задачи регрессии и временных рядов.