🤠 Бэкендеры, найдите себе команду по вайбам! Проверить мэтч → в вайб-квизе
Герман Кастерин (nasdorm), 24 года, Россия, СамараГерман Кастерин (nasdorm), 24 года, Россия, Самара

Герман Кастерин

Junior Data Scientist | ML models for pricing, forecasting & analytics.Ученый по даннымML разработчикМладший (Junior)
Ищу работу

Контакты

Войти
Возраст: 24 года
Опыт работы: 7 месяцев
Регистрация: 23.05.2024
Последний визит: сегодня
Гражданство: Россия
Местоположение: Россия, Самара
Дополнительно: готов к удаленной работе
Знание языков: Английский В2

Обо мне


Технические навыки:

- Языки программирования: Python (pandas, NumPy, SciPy)

- Машинное обучение: Scikit-learn, XGBoost, LightGBM, Optuna

- Временные ряды: TimeSeriesSplit, логи, скользящие средние, автокорреляция

- Глубокое обучение: PyTorch

- Визуализация данных: Matplotlib, Seaborn

- Управление экспериментами: MLflow

- CI/CD: GitLab CI

Софт-скиллы:

- Коммуникабельность: Эффективное участие в обсуждениях и задавание уточняющих вопросов, способствующих улучшению командной работы.

- Адаптивность: Быстрая обучаемость и умение находить решения в условиях неопределенности, что помогает в гибкой настройке моделей и исправлении ошибок.

- Внимание к деталям: Внимательная проверка кода и аналитических выводов для обеспечения высокого качества моделей и интерпретации данных.

Проекты:

House Price Prediction (https://github.com/NasdormML/House_Price_Prediction)

- Kaggle проект по прогнозированию цен на жилье. Используются XGBoost и Scikit-learn для построения моделей регрессии. Проведена оптимизация гиперпараметров с использованием RandomizedSearchCV, что позволило снизить RMSE на 10%. Проект включает анализ корреляции признаков и обработку пропусков данных.

Store Sales - Time Series Forecasting (https://github.com/NasdormML/Store_Sales_Forecasting)

- Kaggle проект по прогнозированию продаж на основе временных рядов. Включает инженерные методы работы с временными признаками, такими как лаги и скользящие средние. Модель на основе XGBoost с оптимизацией гиперпараметров через Optuna позволила снизить RMSLE на 15%. Занял место в топ-450 на Kaggle.

Навыки

Python
NumPy
Pandas
Git
Docker
SQL
PyTorch
CI/CD
ООП
Машинное обучение

Участие в профсообществах

Опыт работы

  • Github
    Ученый по данным (Младший)Data Scientist (Pet Projects, GitHub)
    Май 2024 — По настоящее время (7 месяцев)

    Работа над проектами по машинному обучению и анализу данных на GitHub, с акцентом на задачи регрессии и временных рядов.

    • Проект: House Price Prediction
      Разработка модели для предсказания цен на жилье с использованием XGBoost.
      • Выполнил анализ данных (EDA) для выявления ключевых факторов, влияющих на цену.
      • Оптимизировал модель с помощью GridSearchCV, что снизило RMSE на 10%.
      • Внедрил MLflow для управления экспериментами.
      • Результат: Модель может использоваться для точной оценки стоимости недвижимости риелторами и банками.
    • Проект: Store Sales - Time Series Forecasting
      Прогнозирование продаж розничных магазинов на основе временных рядов.
      • Разработал модель с использованием XGBoost и временных признаков (лаги, скользящие средние).
      • Применил TimeSeriesSplit для корректной валидации временных данных.
      • Оптимизировал модель с помощью Optuna, что снизило RMSLE до 0.75094.
      •  Применил Docker для контейнеризации модели временных рядов, что упростило развёртывание и тестирование.
      • Результат: Модель может использоваться для улучшения управления запасами и планирования продаж в ритейле.

Высшее образование

  • ПГУТИ

    Поволжский государственный университет телекоммуникаций и информатики
    Информатика и вычислительная техника
    Сентябрь 2020 — Июль 2023 (2 года и 10 месяцев)