Контакты: https://socprofile.com/v.anufrikov
У меня есть учебный так и коммерческий опыт работы в области машинного обучения, Благодаря этому мы с командой смогли занять 2 призовых места на Хакатонах по искусственному интеллекту.
Ранее я успешно работал Data Analyst в компаниях Tinkoff и VK, где приобрел ценный опыт в анализе данных и разработке моделей машинного обучения.
Мои навыки включают глубокое понимание таких методов, как регрессия, классификация, кластеризация и нейронные сети. А так же я успешно применяю эти методы для решения широкого спектра задач, включая прогнозирование оттока, классификация текста и прогноз спроса на такси. Мои результаты были важными факторами в принятии бизнес-решений и повышении эффективности операций.
Среди моих увлечений сап-серфинг и фрирайд по горным вершинам зимой. 🏂 Эти хобби помогают мне расслабиться и насладиться жизнью, а также развивают мои навыки анализа, принятия решений и стратегического мышления.
Готов присоединиться к вашей команде и вместе с вами создавать инновационные решения на основе данных.
Используемый стек: Redash, Clickhouse, AirFlow, Python 3, Pandas, Nltk, Git, Jira, Confluence
Провел контентный анализ статей методами ML. Это позволило классифицировать статьи, выделять ключевые слова и определять тональность текста из большого объема данных. Таким образом, мы смогли точно определить категорию статьи и проводить маркетинговые исследования в медиа-проектах.
Создал аналитические панели и показатели в Redash для редакторов и авторов на mail.ru, чтобы они могли писать более увлекательные статьи и анализировать тенденции для постоянных читателей. Это помогает увеличить монетизацию, позволяя получать больше дохода от рекламы на медиа-проектах.
Провел А/Б тесты на снижение количества рекламных блоков. Это позволило уменьшить "захламленность" страницы повысив timespand пользователя, а так же увеличить рекламные доходы от контента на проектах mail.ru на 15%
Используемый стек: Python 3, Pandas, Sklearn, Matplotlib, Re, Nltk, Catboost
Создал систему классификации тональности текстов (NLP) на внутреннем портале банка. Это помогло уменьшить токсичное общения между коллегами и в случае повторного нарушения, руководителю сообщалось об этом сотруднике.
Разработал модель, которая предсказывает вероятность ухода сотрудника. Это позволяет заранее выявить сотрудников, находящихся в зоне риска на основе схожих параметров. Кроме того, модель также анализировала эффективность продаж сотрудника и давала рекомендации о необходимости его удержания или увольнения.
Используемый стек: Tableau, PostgreSQL, Python 3, Pandas, Git, Jira, Confluence
Создавал аналитические дашборды и деревья диагностических метрик в Tableau для менеджерского состава банка, что позволило визуализировать динамику продаж, найти зоны роста сотрудников и увеличить кросс-продажи на 20%.
Проверял гипотезы и по результатам изменял через AB тесты kpi сотрудников банка, для снижения затрат и повышения прибыли бизнес-линий на 5—10% на этапах доставки продуктов.
Разработал и поддерживал витрины по задачам в Jira соответствии бизнес-логике, это упростило построение процессов коллегам на собственных витринах в 1.5 раза.
Описывал документацию проектов в Confluence, писал код согласно руководствам по стилю SQL и стандартами PEP 8, это облегчило проведение review кода и поддержку 12+ проектов одновременно.
Прогнозирование оттока клиентов банка
Описание: предобработка и анализ данных для обучения ML моделей прогнозирования оттока, учитывая дисбаланс классов.
Результат: проект позволил банку сэкономить деньги на дорогостоящем привлечении новых клиентов из-за сохранения клиентской базы.
Технологии: Python 3, Pandas, Sklearn, Matplotlib
Безубыточная разработка скважин
Описание: проверка статистических гипотез, использование техники Bootstrap при расчёте и визуализации в Matplotlib бизнес-показателей по разработке скважин нефтедобывающей компании.
Результат: проект решил проблему выбора скважины для компании и снизил вероятность убытков до 2.5% при бюджете 10 млрд рублей.
Технологии: Python 3, Pandas, Sklearn, Matplotlib, Scipy
NLP Классификация комментариев
Описание: обработка, лемматизация и создание новых признаков для обучения ML модели для определения токсичности текста.
Результат: MVP проект решает проблему поиска токсичных комментариев под постами и отправляет на текст на проверку перед публикацией без дополнительной ручной проверки.
Технологии: Python 3, Pandas, Sklearn, Matplotlib, Re, Nltk, Catboost, Plt
CV Классификация фруктов
Описание: построение свёрточной нейронной сети на наборе данных для классификации фруктов по фотографиям.
Результат: клиенты сети супермаркетов теперь не вводят номер позиции которую взвешивают перед покупкой.
Технологии: Python 3, Tensorflow
Прогнозирование оттока клиентов телеком оператора
Описание: предобработка и анализ данных для обучения ML моделей прогнозирования оттока клиента телеком оператора основываясь на объёме потребляемых услуг
Результат: проект позволил оператору удержать ключевых клиентов за счет предложения системы скидок клиентам которые планировали разорвать контракт
Технологии: Python 3, Pandas, Sklearn, Matplotlib, Catboost
Направление информатики и вычислительной техники, 09.03.01
На всероссийском хакатоне командой «Ling Bizkit» заняли второе место в кейсе от «Digital Consulting Solutions» и «Эвотор», где создали прототип универсальной рекомендательной системы Next Best Offer на примере данных о чеках покупок крупного ритейл игрока.
Используемый стек: lama, RL-модель(https://arxiv.org/pdf/1905.03375.pdf), Python 3, Stremlit
- Приложение может применяться в различных областях бизнеса, независимо от конкретного домена.
- Оно предлагает релевантные товары, основываясь на конкретном местоположении и времени суток.
- Также приложение может предлагать топ-товары конкретной торговой точки.
- С помощью генеративной модели создается фраза для кассира, мотивирующая клиента совершить покупку товара.
Машинное обучение • PyTorch • Reinforcement learning • Обработка естественного языка • Python • Git
На окружном хакатоне командой «Ling Bizkit» предоставили одно из лучших решений и заняли второе место в кейсе от МФЦ Санкт-Петербурга.
Используемый стек: FastAPI, семантический поиск модель sentence transformers, Python 3, Stremlit, PyTorch
Модель использует информацию из базы знаний, преобразует вопрос пользователя, сравнивает его с информацией из базы и выводит ответ. Решение может быть применено в любой области, без потери качества ответов модели при обновлении базы знаний.
Модель содержит систему алгоритмов, которая одновременно с вводом запроса пользователя находит ТОП10 самых похожих вопросов из базы и предлагает их пользователю, а также дает рекомендации пользователю на основе этих метрик, что улучшает качество.
Python • FastAPI • PyTorch • Машинное обучение • NumPy • Нейронные сети• Обработка естественного языка • Computer Science • TensorFlow • Deep Learning