Python, machine learning, transfer learning, ETL, DWH, docker, rest api, linux.
Умею декомпозировать большие задачи на простые, объяснять сложное понятным языком.
Легко переключаюсь между задачами, могу не только в machine learning.
Парсинг отзывов, информации о банках с сайта ЦБ, яндекс карт, постановка на расписание в Airflow. Классификация текстов: тональность отзывов и тема. Интеграция LLM в телеграм бота. Прогнозирование клиентопотока.
Вывод в prod моделей машинного обучения на корпоративных фреймворках, Oozie-потоках, PySpark в контуре крупного банка с прохождением релизного цикла dev/ift/uat/prod. Подключение источников/разработка потоков для загрузки данных в хранилище (Hadoop to Greenplum, Greenplum to Greenplum). Менторство.
Работа с pretrained models - нейронные сети для задач video summarization, paraphrase generation (GPT-3), face swap, object detection/segmentation/counting (в том числе для 3-хмерных point cloud-ов) на данных заказчика. Реализация функционала для пользователя - настройки параметров модели/контекста в web на streamlit, AWS SageMaker. Участие в разработке production pipeline anti-fraud модели с развёртыванием в Docker для приложения крупного банка. Анализ научных публикаций и имплементация в код алгоритмов по оптимизации ставок в интернет-рекламе. Кластеризация, выявление аномалий среди ошибок в кредитной истории.
Разработка ETL процесса для анализа деятельности сотрудников компании: проектирование и разработка DWH с поддержкой историчности (slowly changing dimension), разработка процедур загрузки (REST API) и обновления данных по расписанию в Airflow. Работа с продвинутыми SQL-запросами, хранимыми процедурами, триггерами в Postgres СУБД. Автоматизация построения отчётов, контроль качества данных.
Цифровая обработка физиологических сигналов (временные ряды): fourier, wavelet transform, ICA, PCA, etc. Определение расчётных показателей, детекция падений в рамках проекта https://neuromask.ru. Участие в написании web-приложения на dash и разработке прототипа изделия.
Предобработка и визуализация данных. Развитие и коррекция моделей регрессии, многоклассовой классификации для расчёта индекса надежности контрагентов https://www.spark-interfax.ru/.
Клиническая ординатура по образовательной программе "Неврология".