Лев Богданов (lev_bogdanov), 33 года, Россия, Санкт-ПетербургЛев Богданов (lev_bogdanov), 33 года, Россия, Санкт-Петербург

Лев Богданов

Ученый по даннымML разработчикМладший (Junior)
Ищу работу

Контакты

Войти
Возраст: 33 года
Опыт работы: 2 года и 1 месяц
Регистрация: 05.10.2023
Последний визит: 7 дней назад
Гражданство:
Местоположение: Россия, Санкт-Петербург
Дополнительно: готов к переезду и к удаленной работе
Знание языков: Английский В2

Обо мне

Привет!)
Ищу работу на позицию DS/ML инженера. В работе ценю хороший код, коллег и отлаженные процессы. Готов решать сложные задачи и вносить вклад в развитие команды и компании.

Навыки

SQL
Python
Pandas
MatPlotLib
Git
Docker
PyTorch
Машинное обучение
Анализ данных
FastAPI

Опыт работы

  • Докт24
    Ученый по данным (Младший)
    Сентябрь 2023 — Сентябрь 2024 (1 год и 1 месяц)

    Обязанности:
    – Разработка моделей классификации для предсказания отклонений по имеющимся данным об анализах пациентов
    – Разработка моделей компьютерного зрения для детекции и сегментации объектов на медицинских снимках
    – Разработка бота для автоматизации записи конференций в telegram с последующей транскрибацией, диаризацией и выгрузкой на ЯДиск
    – Автоматизация рабочих процессов и управление задачами с помощью Apache Airflow, включая настройку DAG'ов для мониторинга и развертывания моделей

    Достижения:
    — Высокие метрики в условиях ограниченных наборов данных
    — Разработал модели машинного обучения, которые улучшили точность предсказания отклонений в данных пациентов на 15%
    — Достиг увеличения точности моделей компьютерного зрения для сегментации медицинских изображений на 20%, что значительно улучшило диагностические процессы при ограниченных данных
    — Бот для автоматизации записи конференций помог сократить время на обработку материалов на 25% и повысить их доступность

    Стек: Python, Pandas, Numpy, Matplotlib, Pytorch, Sklearn, CatBoost, LightGBM, Optuna, Ultralytics, Aiogram, Asyncio, Whisper, PyAnnote, Git, Jupyter, Airflow, Docker

  • Яндекс крауд
    Санкт-Петербург
    Аналитик по данным (Младший)Аналитик
    Сентябрь 2022 — Сентябрь 2023 (1 год и 1 месяц)

    Обязанности:
    – Проведение анализа внутренних данных для улучшения клиентского сервиса и повышения удовлетворенности клиентов
    – Исследование и оптимизация коэффициента лояльности клиентов (NPS) с использованием статистических методов
    – Анализ базы знаний и разработка рекомендаций по её реорганизации и актуализации.

    Достижения:
    — Разработал рекомендации для улучшения клиентского опыта, что позволило повысить метрику NPS на 15%
    — Оптимизировал структуру базы знаний, что сократило среднее время обработки обращений на 20%

    Стек: SQL, Python, Pandas, Numpy, Statsmodels, Sklearn, Matplotlib, Seaborn, Tableu

Высшее образование

  • ТИУ

    Тюменский индустриальный университет
    Тюмень322 выпускника
    Институт геологии и нефтегазодобычи
    Сентябрь 2011 — Июль 2016 (4 года и 10 месяцев)

Дополнительное образование

  • Яндекс Практикум

    Обучаем разработчиков, тестировщиков, аналитиков, дизайнеров, интернет-маркетологов
    Апрель 2023 — Сентябрь 2023 (5 месяцев)

    Фриланс/Хакатоны

    Проект по автоматизации проверки звонков.

    Разработка системы автоматической проверки звонков между менеджерами и клиентами с целью повышения качества обслуживания. Проект включал в себя этапы транскрибации аудио, анализа текстов и классификации по различным критериям, основанных на бизнес-требованиях компании.

    Основные задачи и достижения:

    – Автоматическое преобразование аудиозаписей звонков в текст с разделением на голоса (менеджер и клиент) с использованием модели Whisper и библиотеки pyannote
    – Преобразование текстов звонков в числовое представление с использованием подходов TF-IDF и BERT для дальнейшего анализа
    – Разработка и обучение моделей классификации текстов для автоматического определения ключевых критериев (например, качество общения, соблюдение сценария, использование рекомендованных фраз) с использованием Pytorch и Sklearn
    – Настройка и автоматизация выполнения всех процессов с использованием Apache Airflow. Контейнеризация приложений и моделей с помощью Docker для стабильного и удобного развертывания.

    Основной результат: Повышение эффективности проверки звонков за счёт автоматизации процесса анализа и классификации, что сократило время обработки более чем на 65%.

    Технологический стек: Python, Pytorch, Whisper, Pyannote, BERT, TF-IDF, Sklearn, Pickle, Numpy, Pandas, Transformers (HuggingFace), Librosa, Docker, Apache Airflow.
    --------------------------------------------------------

    Разработка системы для автоматизации обработки и поиска информации о товарах в существующей базе данных с использованием Telegram-бота. Проект ориентирован на модульную архитектуру и соблюдение стандартов разработки.

    Основные задачи и достижения:

    – Создание Telegram-бота, принимающего файлы с запросами от пользователей. Поддержка различных форматов файлов и гибкая работа с текстом.
    Обработка и нормализация данных: Автоматическая обработка и нормализация данных из поступающих файлов, преобразование их в табличный вид для дальнейшего анализа
    – Эффективный поиск товаров в существующей базе данных с использованием оптимизированных алгоритмов поиска и фильтрации
    – Разработка API с использованием FastAPI для дальнейшей интеграции с сервисами компании, что обеспечивает гибкость и возможность масштабирования системы
    – Разработка проекта с высокой степенью модульности, поддержка расширяемости и легкости в обслуживании
    Основной результат: Автоматизация обработки пользовательских запросов и упрощение поиска товаров, что значительно увеличило точность и скорость получения информации

    Cтек: Python, Pandas, Openpyxl, Aiogram, FastAPI, Docker
    --------------------------------------------------------

    Финалист хакатона GPN Intelligence Cup 2023 от Газпрома, направление Data Science.
    Задача — составление расписания цен на товары в различных городах на 90 дней вперёд, основываясь на ценах конкурентов.
    – Предобработка данных, устранение аномалий и выбросов с сохранением максимального количества информации
    – Анализ временных рядов с использованием статистических методов для выявлением трендов и сезонных паттернов
    – Feature-engineering, выделение признаков, обучение и валидация моделей для прогнозирования цен
    Стек: Pandas, Numpy, Statsmodels, Matplotlib, Seaborn, Sklearn, Prophet, ARIMA, PyTorch.