Программист, компьютерный лингвист, специалист в сфере NLP и веб-парсинга
Анализ телеметрии пользователей консолей Loupedeck, внедрение программного обеспечения с применением методов data science. Создание визуализаций. Выявление закономерностей в данных, обеспечившее принятие ключевых решений менеджментом
Технический стек:
Azure Data Explorer
ADX Dashboards
Python
Azure Cloud web applications
Kusto Query Language
Разрабатывал веб-парсеры для получения данных с различных веб-сайтов, включая онлайн каталоги, онлайн магазины и 2gis.
Применял язык программирования Python и выражения XPath для эффективного сбора данных с веб-страниц.
Осуществлял выгрузку полученных данных в таблицы формата Excel, обеспечивая удобную обработку и анализ полученных результатов.
Технический стек:
Язык программирования: Python
Библиотеки и фреймворки: Python Scrapy
Выражения XPath
Выгрузка данных в таблицы Excel
Разработка инструментов анализа данных и деплой моделей машинного обучения:
Проектировал и разрабатывал инструменты анализа данных, используя язык программирования Python, для обработки и визуализации больших объемов данных заказчика.
Отвечал за исправление ошибок и улучшение функциональности существующих инструментов анализа данных.
Осуществлял деплой моделей машинного обучения в продакшн, обеспечивая их бесперебойную работу и оптимальную производительность.
Оценивал качество моделей и проводил анализ результатов, предоставляя заказчику ценные инсайты для принятия бизнес-решений.
Занимался анализом данных в PostgreSQL базе данных, извлекая и обрабатывая необходимую информацию.
Веб-программирование системы отчетов по метрикам моделей:
Разрабатывал веб-приложение для предоставления отчетов по метрикам моделей машинного обучения.
Использовал стек технологий, включая SQL, Python, JS, и HTML, для создания пользовательского интерфейса и взаимодействия с базой данных.
Обеспечивал удобную визуализацию данных и интуитивно понятный интерфейс для заказчика.
Технический стек:
Язык программирования: Python, JavaScript
SQL и PostgreSQL для работы с базой данных
Веб-технологии: HTML, CSS
Инструменты анализа данных и машинного обучения
Принимал активное участие в разработке веб-приложения для онлайн конкорданса - веб-приложения для анализа текстов с возможностью поиска и выдачи контекстуальных данных.
Использовал языки программирования Python и JavaScript для реализации функциональности приложения.
Применял дистрибутивные модели эмбеддингов на корпусах русского языка на суперкластере, предназначенном для вычислений, требующих большого количества памяти
Интегрировал алгоритмы кластеризации из модуля scikit-learn для обработки и анализа текстовых данных.
Занимался исправлением ошибок в существующем коде и оптимизацией его производительности.
Добавлял и обслуживал большой корпус текстов в базе данных, обеспечивая быструю и точную выдачу данных пользователю.
Технический стек:
Язык программирования: Python, JavaScript
Использование алгоритмов кластеризации из scikit-learn
Базы данных: MySQL
Анализ и решение проблем, тестирование ERP-приложения, создание тест-кейсов
SQL, ARS
Jira
Подготовка данных для обучения системы машинного перевода.
Автоматизированное тестирование качества машинного перевода