Читаете ли вы блог Хабр Карьеры? Если да — оцените, как мы справляемся. А если нет — расскажите, что читаете для развития карьеры. Пройти опрос (займет 5-7 минут)
Опыт работы
Разрабатываем мобильные приложения для бизнеса с 2011 года, специализируемся в области CV, ML, AI
Data Scientist
Октябрь 2018 — По настоящее время (1 год и 10 месяцев)
  1. Подобрала и обучила оптимальный детектор товаров и ценников на фотографиях полок в продовольственных магазинах. Это позволило повысить качество детекции с 71 до 99%.
  2. Разработала алгоритм для детекции цен на ценниках с учетом масштаба, поворота, плохого качества фотографии, оптимальный для более 2000 различных сетей магазинов России и мира.
  3. Обучила нейронную сеть для распознавания цен на ценниках с точностью 97%.
  4. Разработала математическую модель для определения объема товара по его цене. Это позволило повысить точность всего пайплайна на 15%.
  5. Оптимизировала скорость работы детектора товаров и ценников на CPU. Это позволило ускорить выполнение всего пайплайна в 2,5 раза.
  6. Подобрала оптимальный с учетом скорости и точности ансамбль моделей для распознавания текста на фотографии.
  7. Оптимизировала и переобучила модели с учетом особенностей русского текста.
  8. Разработала алгоритм по разделению слов на символы на размеченных фотографиях. Это позволило применить полученную модель на данных, не использованных в обучение и расширило область применения.
  9. Обучила модель для классификации товаров из сложных категорий по распознанному тексту с точностью 94% (точность классификации таких товаров по фотографии составляла 22%).
  10. Изучила современные архитектуры и подобрала оптимальную модель для классификации объектов в видеопотоке с точностью 93%.
  11. Оптимизировала параметры модели для работы в режиме реального времени. Скорость работы увеличилась в 1,3.
  12. Доработала скрипт для классификации объектов по частям фотографии. Это позволило точно отличать объекты, сильно похожие друг на друга.
  13. Разработала архитектуру нейронной сети для предсказания спроса на новый дизайн ювелирных украшений с точностью 87% (точность существующих методов у заказчика составлял 32%) с учетом фотографии, характеристик изделия, а также уже существующих украшений на рынке.
  14. Написала алгоритм для визуального отображения, почему нейронная сеть приняла такое решение.
  15. Разработала рекомендательную систему по изменению элементов дизайна украшения для повышения на него спроса.
  16. Подобрала и обучила модель для генерации новых дизайнов ювелирных украшений для ускорения работы дизайнеров.
  17. Оптимизировала и доработала модели, указанные в пунктах 1-9, для получения данных о товарах и ценах из рекламных буклетов. Точность составила 87%.
  18. Разработала систему моделей для ценообразования с целью повышения среднего чека.
  19. Подобрала и обучила модель для анализа покупательской корзины. Данная модель позволила повысить продажи прикассовых товаров на 15%.
  20. Подобрала и обучила модель для предсказания эффективности работы нового магазина в зависимости от места расположения с точностью 96%.
  21. Написала несколько парсеров для автоматизированного сбора информации с различных источников о трафике людей, конкурентах и других значимых параметрах. Эти данные позволили повысить качество модели на 12%.
  22. Разработала ансамбль нейронных сетей для расчета эффективной цены продажи квартиры в зависимости от характеристик квартиры, места расположения, а также предложений и цен конкурентов с точностью 98%.
  23. Написала парсеры для автоматизированного сбора информации о предложениях конкурентов.
  24. Доработала алгоритм моделей для получения информации о том, какие факторы модель посчитала значимыми в каждом конкретном случае.
  25. Подобрала и обучила оптимальную модель для автоматического получения данных о квартире с технологического плана и рекламных буклетов. Это позволило ускорить сбор данных.
  26. Также разработала модели и алгоритмы для следующих задач:
    1. Предсказание эффективности работы нового сотрудника, а также вероятности увольнения текущих сотрудников.
    2. Предсказания вероятности возникновения аварии на производстве по вине сотрудника.
    3. Классификация сообщений и автоматических ответов в чат-боте.
    4. Подбор оптимальных параметров работы ГЭС.
  27. Также в мои обязанности входит:
    1. Проведение обучающих лекций на курсах машинного обучения и менеджмента для новых сотрудников.
    2. Изучение современных методик в области глубокого обучения и машинного обучения, чтение научных статей, просмотр материалов релевантных конференций.
ООО "Молл"
Челябинск
Data Scientist
Апрель 2017 — Октябрь 2018 (1 год и 7 месяцев)
  1. Разработка системы прогнозирования спроса на продуктовые товары с точностью 92%: анализ факторов, разработка алгоритмов и моделей, написание программного кода в  Microsoft SQL Server, тестирование и сопровождение.
  2. Разработка системы прогнозирования спроса на непродуктовые товары на Python с точностью 97%: разработка модулей прогнозирования методами k-means, линейная регрессия, случайный лес, градиентный бустинг и др (с использованием библиотек sklearn, xgboost, H2O).
  3. Разработка системы анализа и прогнозирования временных рядов с помощью рекуррентных нейронных сетей (с использованием библиотек Keras, TensorFlow). Применение данной архитектуры позволило повысить точность прогнозирования на 12%. 
  4. Разработка алгоритма кластеризации товаров по принадлежности к пользовательским корзинам на Python. Применение алгоритма позволило повысить продажи товаров кассовой зоны на 17%.
  5. Работа над разработкой алгоритма классификации покупателей по группам интересов.
  6. Разработка алгоритмов автоматического анализа данных о продажах на SQL и Python: загрузка данных из базы данных, математический анализ, построение графиков и таблиц, загрузка результатов в базу данных или предоставление пользовательских отчетов.
  7. Визуализация аналитических отчетов в программе QlikView для конечного пользователя.
  8. Разработка баз данных: разработка моделей, создание необходимых таблиц, связей между таблицами, автоматических заданий, администрирование базы данных в рамках разрабатываемых проектов.
  9. Написание пользовательской документации: описание алгоритмов, руководств пользователей, руководств для администраторов, технических заданий, создание презентаций.
Data Scientist
Август 2011 — Март 2017 (5 лет и 8 месяцев)
  1. Подготовка данных и обучение интеллектуальной системы локализации и классификации дефектов на фотографиях поверхности металлопроката.
  2. Разработка математической модели и написание программного кода на Python для локализации малоконтрастных дефектов на фотографиях поверхности металлопроката (модель позволила системе отличать дефекты от загрязнений и воды). Внедрение данного алгоритма позволило повысить точность классификации на 35%.
  3. Разработка алгоритмов расчета влияния технологических параметров и их совокупности на вероятность появления поверхностных дефектов. Регрессионный анализ процессов. Написание технологических инструкций.
Высшее образование
Магнитогорский государственный технический университет им. Г.И. Носова
Магнитогорск
Факультет: Автоматики и вычислительной техники
Сентябрь 2006—Июнь 2011 (4 года и 9 месяцев)
Приборы и методы контроля качества и диагностики