Привет!
Ищу работу на позицию DS/ML инженера. В работе ценю хороший код, коллег и отлаженные процессы. Готов решать сложные задачи и вносить вклад в развитие команды и компании.
Обязанности:
– Разработка и оптимизация моделей машинного обучения для анализа текстовых данных, кластеризации дефектов и классификации звонков
– Применение NLP-методов (BERT, Universal Sentence Encoder, TF-IDF) для обработки текстов, формирования эмбеддингов и поиска схожих объектов
– Автоматизация транскрибации, диаризации и анализа звонков с использованием Whisper и PyAnnote
– Разработка Telegram-бота для поиска товаров, создание API на FastAPI и оптимизация алгоритмов поиска
– Контейнеризация сервисов с Docker, настройка процессов в Apache Airflow для мониторинга и автоматизированного развертывания
Достижения:
— Повышена точность классификации звонков и автоматизирован анализ, что сократило время проверки на 80%
— Оптимизирован процесс кластеризации дефектов, что упростило выявление проблемных зон и ускорило анализ данных
— Улучшена точность поиска товаров, что повысило эффективность работы системы и удобство пользователей
— Автоматизированные решения интегрированы в бизнес-процессы, что улучшило качество обслуживания и сократило ручную обработку данных
Стек: Python, Sklearn, Pytorch, Transformers (HuggingFace), BERT, Universal Sentence Encoder, TF-IDF, DBSCAN, K-Means, UMAP, Pandas, Plotly, FastAPI, Aiogram, Whisper, PyAnnote, Apache Airflow, Docker
Обязанности:
– Разработка моделей классификации для предсказания отклонений по имеющимся данным об анализах пациентов
– Разработка моделей компьютерного зрения для детекции и сегментации объектов на медицинских снимках
– Разработка бота для автоматизации записи конференций в telegram с последующей транскрибацией, диаризацией и выгрузкой на ЯДиск
– Автоматизация рабочих процессов и управление задачами с помощью Apache Airflow, включая настройку DAG'ов для мониторинга и развертывания моделей
Достижения:
— Высокие метрики в условиях ограниченных наборов данных
— Разработал модели машинного обучения, которые улучшили точность предсказания отклонений в данных пациентов на 15%
— Достиг увеличения точности моделей компьютерного зрения для сегментации медицинских изображений на 20%, что значительно улучшило диагностические процессы при ограниченных данных
— Бот для автоматизации записи конференций помог сократить время на обработку материалов на 25% и повысить их доступность
Стек: Python, Pandas, Numpy, Matplotlib, Pytorch, Sklearn, CatBoost, LightGBM, Optuna, Ultralytics, Aiogram, Asyncio, Whisper, PyAnnote, Git, Jupyter, Airflow, Docker
Обязанности:
– Проведение анализа внутренних данных для улучшения клиентского сервиса и повышения удовлетворенности клиентов
– Исследование и оптимизация коэффициента лояльности клиентов (NPS) с использованием статистических методов
– Анализ базы знаний и разработка рекомендаций по её реорганизации и актуализации.
Достижения:
— Разработал рекомендации для улучшения клиентского опыта, что позволило повысить метрику NPS на 15%
— Оптимизировал структуру базы знаний, что сократило среднее время обработки обращений на 20%
Стек: SQL, Python, Pandas, Numpy, Statsmodels, Sklearn, Matplotlib, Seaborn, Tableu
Специализация: автоматизированные системы обработки информации и управления