Я являюсь начинающим Data scientist-ом и стремлюсь начать карьеру в этой сфере. На протяжении нескольких лет я занимаюсь изучением курсов и участием в соревнованиях по машинному обучению. Также в качестве фриланса занимаюсь первичной обработкой табличных данных.
Pet project: Рекомендательная сисистема
• Создание персональной рекомендательной системы товаров для покупателей;
• Архитектура: Использование двухэтапной архитектуры с использованием модели
колаборативной фильтрации (LightFM) и модели ранжирования (CatBoost).
Kaggle соревнование: Stable Diffusion - Image to Prompts
• Вошел в топ 8% (бронзовая медаль)
• Создание модели, позволяющей предсказать текстовое описание, на основе которого было создано изображение.
• Поиск или генерация своего датасета пар изображение/текстовое описание
• Данные: открытый датасет DiffusionDB 2Million Image-Prompt. Модели: VIT, ConvNext и KNN
• Администрирование баз данных;
• Администрирование сетевой инфраструктуры банка.
• Выполнение лабораторных и курсовых работ по первичной
обработке и предварительному анализу табличных данных.
• Задачи: Ознакомление со структурой данных, проверка данных на
наличие выбросов и пропущенных значений, создание новых
признаков, построение графиков распределения признаков, выбор
модели для предсказания целевого признака.
• Библиотеки: Numpy, Pandas, Matplotlib, Seaborn, Sklearn
• Внедрение и администрирование СЗИ/СКЗИ;
• Составление и подготовка отчетной документации;
• Автоматизация рутинных задач с помощью Python