Разработала рекомендательную систем с bert4rec
Разработала модель ценообразования
Разработала модель прогнозирования спроса и дохода
Разработала модель эластичности товаров
Проводила A/B-тесты
Проводила рефакторинг и оптимизацию кода
Полный цикл разработки (data collection, feature engineering, model fitting, model management, visualization, model serving)
Технологический стек: linux, pandas, numpy, scipy, sklearn, catboost, lightgbm, prophet, optuna, pytorch, ambrosia, airflow, clearml, grafana, git, docker
Сбор и подготовка данных (очистка данных, feature engineering)
Разработка скриптов для создания feature store, оптимизация SQL запросов
Разведочный анализ данных, проверка гипотез, поиск выбросов, отбор признаков, разработка моделей для восстановления пропусков в данных
Определение портрета клиента
Разработка моделей отклика по страховым продуктам, тюнинг моделей, разработка кастомных лосс-функций
Разработка моделей для проведения рекламных кампаний
Разработка x-sell моделей по страховым продуктам
Работа с AutoML библиотеками
Управление жизненным циклом моделей с MLflow
Обработка данных с PySpark
Калибровка моделей
Подготовка моделей к выходу в прод
Работа с библиотеками pandas, numpy, scipy, sklearn, catboost, lightgbm, optuna, pytorch, tensorflow
Работа с Git
Работа с docker
Работа с Linux
Решение CV задач (классификация изображений, детекция и классификация объектов на изображении) с использованием нейронных сетей, решение ocr задач
Сбор данных (SQL), оптимизация запросов
Подготовка данных, очистка и стандартизация данных
Обработка текстовых данных (сегментация, стемминг, лемматизация), построение моделей машинного обучения для классификации текстовых данных (sklearn, pytorch), применение байесовского классификатора
Разработка библиотеки процессной аналитики, визуализация (matplotlib, seaborn), оптимизация и рефакторинг модулей, тестирование модулей с pytest
Применение методов линейноной алгебры и математической статистики для реализации функционала библиотек процессной и графовой аналитики
Управление командой разработки, распределение задач, оценка трудозатрат и времени выполнения
Code Review
Работа с Git
Работа с Linux
Подготовка набора данных для нейронных сетей, разметка изображений
Разработка нейронных сетей для классификации изображений
Применение методов сегментации изображений, разработка нейронной сети для сегментации изображений
Разработка программы для определения размеров объектов на изображении
Статистический анализ данных
По результатам работы была опубликована статья на английском языке.
Фундаментальная информатика и информационные технологии (магистратура)
Фундаментальная информатика и информационные технологии (бакалавриат)
Математика для анализа данных
Обучение на размеченных данных
Поиск структуры и построение выводов по данным
Прикладные задачи анализа данных