Привет!)
Ищу работу на позицию DS/ML инженера. В работе ценю хороший код, коллег и отлаженные процессы. Готов решать сложные задачи и вносить вклад в развитие команды и компании.
Обязанности:
– Разработка моделей классификации для предсказания отклонений по имеющимся данным об анализах пациентов
– Разработка моделей компьютерного зрения для детекции и сегментации объектов на медицинских снимках
– Разработка бота для автоматизации записи конференций в telegram с последующей транскрибацией, диаризацией и выгрузкой на ЯДиск
– Автоматизация рабочих процессов и управление задачами с помощью Apache Airflow, включая настройку DAG'ов для мониторинга и развертывания моделей
Достижения:
— Высокие метрики в условиях ограниченных наборов данных
— Разработал модели машинного обучения, которые улучшили точность предсказания отклонений в данных пациентов на 15%
— Достиг увеличения точности моделей компьютерного зрения для сегментации медицинских изображений на 20%, что значительно улучшило диагностические процессы при ограниченных данных
— Бот для автоматизации записи конференций помог сократить время на обработку материалов на 25% и повысить их доступность
Стек: Python, Pandas, Numpy, Matplotlib, Pytorch, Sklearn, CatBoost, LightGBM, Optuna, Ultralytics, Aiogram, Asyncio, Whisper, PyAnnote, Git, Jupyter, Airflow, Docker
Обязанности:
– Проведение анализа внутренних данных для улучшения клиентского сервиса и повышения удовлетворенности клиентов
– Исследование и оптимизация коэффициента лояльности клиентов (NPS) с использованием статистических методов
– Анализ базы знаний и разработка рекомендаций по её реорганизации и актуализации.
Достижения:
— Разработал рекомендации для улучшения клиентского опыта, что позволило повысить метрику NPS на 15%
— Оптимизировал структуру базы знаний, что сократило среднее время обработки обращений на 20%
Стек: SQL, Python, Pandas, Numpy, Statsmodels, Sklearn, Matplotlib, Seaborn, Tableu
Фриланс/Хакатоны
Проект по автоматизации проверки звонков.
Разработка системы автоматической проверки звонков между менеджерами и клиентами с целью повышения качества обслуживания. Проект включал в себя этапы транскрибации аудио, анализа текстов и классификации по различным критериям, основанных на бизнес-требованиях компании.
Основные задачи и достижения:
– Автоматическое преобразование аудиозаписей звонков в текст с разделением на голоса (менеджер и клиент) с использованием модели Whisper и библиотеки pyannote
– Преобразование текстов звонков в числовое представление с использованием подходов TF-IDF и BERT для дальнейшего анализа
– Разработка и обучение моделей классификации текстов для автоматического определения ключевых критериев (например, качество общения, соблюдение сценария, использование рекомендованных фраз) с использованием Pytorch и Sklearn
– Настройка и автоматизация выполнения всех процессов с использованием Apache Airflow. Контейнеризация приложений и моделей с помощью Docker для стабильного и удобного развертывания.
Основной результат: Повышение эффективности проверки звонков за счёт автоматизации процесса анализа и классификации, что сократило время обработки более чем на 65%.
Технологический стек: Python, Pytorch, Whisper, Pyannote, BERT, TF-IDF, Sklearn, Pickle, Numpy, Pandas, Transformers (HuggingFace), Librosa, Docker, Apache Airflow.
--------------------------------------------------------
Разработка системы для автоматизации обработки и поиска информации о товарах в существующей базе данных с использованием Telegram-бота. Проект ориентирован на модульную архитектуру и соблюдение стандартов разработки.
Основные задачи и достижения:
– Создание Telegram-бота, принимающего файлы с запросами от пользователей. Поддержка различных форматов файлов и гибкая работа с текстом.
Обработка и нормализация данных: Автоматическая обработка и нормализация данных из поступающих файлов, преобразование их в табличный вид для дальнейшего анализа
– Эффективный поиск товаров в существующей базе данных с использованием оптимизированных алгоритмов поиска и фильтрации
– Разработка API с использованием FastAPI для дальнейшей интеграции с сервисами компании, что обеспечивает гибкость и возможность масштабирования системы
– Разработка проекта с высокой степенью модульности, поддержка расширяемости и легкости в обслуживании
Основной результат: Автоматизация обработки пользовательских запросов и упрощение поиска товаров, что значительно увеличило точность и скорость получения информации
Cтек: Python, Pandas, Openpyxl, Aiogram, FastAPI, Docker
--------------------------------------------------------
Финалист хакатона GPN Intelligence Cup 2023 от Газпрома, направление Data Science.
Задача — составление расписания цен на товары в различных городах на 90 дней вперёд, основываясь на ценах конкурентов.
– Предобработка данных, устранение аномалий и выбросов с сохранением максимального количества информации
– Анализ временных рядов с использованием статистических методов для выявлением трендов и сезонных паттернов
– Feature-engineering, выделение признаков, обучение и валидация моделей для прогнозирования цен
Стек: Pandas, Numpy, Statsmodels, Matplotlib, Seaborn, Sklearn, Prophet, ARIMA, PyTorch.