28 мая соберемся на вебинар и обсудим, как изменился рынок, почему внутренний бренд становится главным каналом внешнего, и какие бенефиты нельзя резать, даже когда бюджет на нуле
28 мая соберемся на вебинар и обсудим, как изменился рынок, почему внутренний бренд становится главным каналом внешнего, и какие бенефиты нельзя резать, даже когда бюджет на нуле
Автор новой перспективной технологии искусственного интеллекта
Сочетаю в себе квалификацию и многолетний
опыт учёного-практика, аналитика данных,
архитектора и проектировщика
интеллектуальных систем, профессионального
программиста.
Лидер команды, наставник.
Способен находить решения сложных
нетривиальных задач.
Потребность решать такие задачи, находить новые подходы - в ряд
проектов меня приглашали после того,
как нужный результат не удавалось
получить мейнстрим-инструментами (нейросети,
NLP-инструменты, поисковые
движки и т.п.) - побудили меня применить
передовые достижения наук о мозге,
которые составят теоретический фундамент
ИИ будущих поколений, не ожидая, пока
для них будут разработаны мат. аппарат,
алгоритмы, …, а сделать это самому, для задач текущего проекта. Так в
практическом решении многих задач
разных проектов за 15 лет сформировался
методический и технологический комплекс,
который можно назвать [оригинальной]
технологией ИИ (опережающей мейнстрим).
Ключевые научные источники технологии
— Теория функциональных систем (как
конструктивная теория мозга), новейшая
когнитивная модель мозга «Когнитом»
академика К.В.Анохина.
Разработанная мной техническая модель
когнитома получила рабочее название
«Нейросемантическая
гиперсеть» (НСГС). В отличие от
«чёрных ящиков»
нейросетей и других моделей ML,
НСГС — это
полностью «белый
ящик». Все её элементы, включая числовые
параметры, осмысленны, легко интерпретируются
человеком, могут быть им изменены и
дополнены. Результаты алгоритмов также
естественным образом получают
семантическую интерпретацию.
Сочетая нейробиологические концепции
с глубоким пониманием теории информации,
мне удалось отыскать несколько очень
удачных формул оценки информативности,
семантической значимости соотношений
в массивах данных, включая тексты. Они
легли в основу метрик числовых параметров
связей когнитома, ранжирующих коэффициентов
интеллектуальных функций. Это позволило
создать высокоэффективные алгоритмы
извлечения знаний из массивов данных,
наполнения НСГС знаниями
согласно системно-селективной концепции
научения (а не инструктивной, как в ML).
Нет необходимости «обучать» когнитом
решению конкретной задачи. Мы можем
«научать»
его, накапливая знания, полученные в
разное время, от разных источников,
сочетая разные способы: автоматические
алгоритмы, полуавтоматические (с
подтверждением гипотез человеком или
другим алгоритмом), прямое внесение
знаний человеком.
Полная открытость, управляемость и
гибкость создают огромные преимущества.
Условия многих проектов таковы, что
применить на старте машинное обучение
попросту не на чем - отсутствуют
размеченные датасеты или они очень
низкого качества (а современные ML-модели
превзойти точность обучающего датасета
не могут). С НСГС мы можем успешно
стартовать даже с минимальных позиций,
используя поначалу знания человека,
сочетая способы научения, доступные в
имеющихся условиях, постепенно наполняя
знаниями «машинный
мозг» (одновременно
получая качественно размеченные
датасеты).
Накопление знаний создаёт положительную
обратную связь: с ростом «наученности»
машинного мозга, онтологии предметной
области, новые знания удаётся получать
всё быстрее и с возрастающей степенью
автоматизации.
Растущий в своих компетенция машинный
мозг применяем для широкого спектра
целей и задач: создание и развитие
инструментов и сервисов (высокоточный
интеллектуальный поиск, семантическая
навигация, классификации и кластеризации,
поиск похожих,
автоматизированное
формирование таксономий и словарей
предметной области, рекомендации и
т.п.), быстрое получение ответов на
возникающие запросы, аналитика,
инфографика и т.д.
Подход выгодно отличают гибкость,
многоплановость, системность, возможность
даже в сложных условиях исходных данных
получать результаты высокого качества
и точности, преодолеть «стеклянный
потолок» современных мейнстрим-методов,
превзойти конкурентные решения.
Это доказывают результаты реализованных
проектов.
Так, рекомендательный
сервис для авторов книг, публикующих
их на маркет-плейсах, был признан
пользователями превосходящим по качеству
рекомендаций аналогичный сервис Amazon.
Благодаря чему стартап, для которого я
реализовывал функциональность
рекомендаций, был куплен
издательским гигантом Макмиллан.
В другом проекте реализованный
мной высокоточный интеллектуальный
поиск компаний по множеству ассоциированных
с ними текстов вышел
несопоставимо более качественным и
полезным, чем реализованный для тех же
целей на основе Elasticsearch.
Прототип системы классификации
писем граждан мэру Москвы, будучи
«наученным» на массиве решений операторов,
показал точность классификации выше
операторской (т.е. качество результата
выше качества в обучающем массиве, а
именно качество классификации операторами
не устраивало руководство).
Ранее, созданная моей
лабораторией многофункциональная
система аналитики больших текстовых
потоков опередила решения
компаний-конкурентов, эксплуатировалась
весьма серьёзными заказчиками, развивалась
по их требованиям.
В течение последнего десятка
лет «машинный мозг» проектируемых
систем мы реализовывали
на PostgreSQL (которым я владею в совершенстве)
- как данные нейросемантической гиперсети,
так и программный код ключевой
функциональности.
Таким образом, технология
100%-но отечественная, от фундаментальных
научных основ до программного кода.
Технология постоянно
развивается, каждый новый проект
привносит в неё усовершенствования,
новые интеллектуальные возможности,
функции, ноу-хау.


Выберите навык, чтобы посмотреть, какие тесты специалист уже прошел.
Разработка архитектуры, методологии, компонентов цифровых продуктов Университета, анализ массивов данных; проектирование NLP-методик, инструментов, сервисов; наставничество.
Разработана система анализа и приёмки цифровых следов обучения. В ней в 2021-24 гг. принимались цифровые следы обучения по федеральным программам «Персональные цифровые сертификаты», «Цифровые профессии», «Искусственный интеллект», «Код будущего». Разработал архитектуру системы, реализовал на PostgreSQL техпроцессы, обучил специалиста для эксплуатации и дальнейшего развития системы (включая обучение с нуля PostgreSQL).
Разработал
ряд NLP-компонентов
техпроцессов, связанных с вышеуказанными
программами: анализ поступающих учебных
программ, их классификация по заданным
областям, проверка соответствия
заявленной теме, нахождение похожих
курсов и повторных подач заявок,
семантический поиск
курсов и т.п.
Анализ
массивов рефлексий по результатам
обучения, в том числе извлечение из них
знаний об учебных курсах.
Создал прототип подсистемы интеллектуального поиска компаний, семантической навигации, подбора похожих компаний и т.п. для сервиса «Радар» Платформы НТИ. Система демонстрирует очень высокое качество, точность и интеллектуальные возможности, несопоставимо более высокие, чем ранее созданная на основе Elasticsearch.
Поскольку в ряде проектов на старте отсутствовала возможность применить автоматическое обучение (не было не только размеченных массивов, но и нужных классификаторов/таксономий), разработал ряд методик и инструментов автоматизированного построения таксономий и словарей областей интереса, включая инструменты работы с большими массивами текстов без их индексирования.
Технология получила мощный толчок в развитии, разрешён ряд «тонких моментов» в анализе текстов и сопоставлении подсетей нейросемантической гиперсети, существенно увеличены скорость обработки, управляемость параметрами результатов, точность и качество.
Проектирование аналитических, рекомендательных компонентов, интеллектуальных функций для информационных систем Правительства Москвы.
В развитие предшествующих своих наработок и технологий хорошо отработаны методология и технология обучения (по комплексу источников первичных данных) для целей ... и собственно многоканальные "живой семантический поиск" и индивидуальные рекомендации в реальном времени
Проекты:
- классификация и направление по органам рассмотрения обращений граждан в органы власти Москвы;
- вопросно-ответная система, ориентированная на сайт mos.ru;
- интеллектуальные компоненты для информационной системы инновационно-производственного кластера Москвы: семантический поиск, рекомендации партнёров/поставщиков/потребителей, поиск похожих компаний по комплексу критериев, ...
Аналитика клиентской базы, проектирование аналитических инструментов, развёртывание data- аналитического центра и data- аналитической инфраструктуры компании.
Помимо регулярной аналитики клиентской базы и финансовых потоков создал с применением Wolfram Mathematica ряд высокоинформативных динамических отчётов для периодического предоставления "картины происходящего" бизнес-руководителям
Уволился из-за ликвидации компании (отзыв лицензии Банком России)
Проектирование архитектоники и ключевой функциональности аналитической подсистемы продукта компании.
Приобрёл отличный опыт проектирование сложных архитектур и реализации сложных высокоскоростных запросов к большим массивам данных на PosgreSQL.
Уволился из-за ликвидации компании
Целями деятельности руководимой мной группы (в составе НИЛ ИТС, о которой говорится ниже) были:
- исследование новых сложных задач информационной аналитики и поиск решений - как системных в целом, так и частных для реализации сложных интеллектуальных функций;
- разработка методов и алгоритмов, архитектуры системы и её сложной взаимосвязанной функциональности;
- макетирование системных решений;
- реализация функциональности в форме АПИ для включения в продукты компании или создания таких продуктов.
Успешно реализован ряд проектов в области аналитики данных различной природы и в особенности - больших массивов и потоков текстов, в ряде случаев очень трудной для анализа природы - далёкий от литературного язык, чрезвычайно высокая зашумлённость, вплоть до активного противодействия различными способами распознаванию текста (последнее - например, в таможенных декларациях для противодействия обнаружению провоза запрещённых по различным критериям товаров).
Некоторые из реализованных проектов:
- идентификация автора печатного текста;
- анализ социальных сетей;
- обнаружение представляющих интерес зависимостей в потоке финансовых данных;
- анализ журналов активности с целью обнаружения угроз информационной безопасности;
- анализ таможенных деклараций с целью обнаружения запрещённых по разным условиям товаров (проект для Таможенного Комитета РФ);
- многофункциональная система аналитики больших массивов и потоков текстов (многолетний проект с множественными выходами в продукты, для разных заказчиков);
- технология и система быстрого формирования онтологий предметных областей (в том числе для усиления предыдущей системы).
В первые месяцы нашей работы в этой сфере мы пытались применять известные решения, в частности, несколько лингвистических процессоров, нейронные сети и другие. Результаты достигались "обычные" для таких подходов, тогда как от нас требовались результаты "прорывные". В упомянутых условиях реальных текстов, подлежащих анализу, лингвистические процессоры ожидаемо давали сбой.
Всё это подтолкнуло меня к поиску принципиально новых подходов, и такой подход был найден. Он заключается в создании средств искусственного интеллекта не на основе математического аппарата, созданного кем-то и сильно отстающего от передовых результатов наук о мозге, а в техническом переложении комплекса передовых знаний, полученных непосредственно из наук о мозге, системных учений о мозге и результатов исследований вплоть до новейших, ещё далёких от переложения в матаппарат (например, так называемая «Единая теория мозга и разума», создаваемая академиком К.В.Анохиным непосредственно в настоящее время) - самостоятельно генерируя на основе этих знаний методы, алгоритмы, формулы и т.д. адекватно специфике и контексту поставленной конкретной задачи и создаваемой системы.
Этот путь привёл нас к успеху, и данный подход реализовался в комплексе методов, архитектур, алгоритмов, формул во всех последующих проектах, не только для данной компании, он развивается мной и в настоящее время, постоянно совершенствуясь и обогащаясь в новых проектах, в частности - упомянутых выше для компании Pronoun, ДИТ Москвы.
Вкратце, результаты в целом:
- архитектуры баз знаний, методы и алгоритмы управления знаниями;
- анализ больших массивов данных, выявление неявных зависимостей, закономерностей - в различных задачах под заказанные требования и условия;
- структурирование в больших массивах данных, экстрагирование знаний, семантическая навигация;
- выявление нетипичной активности любого вида в базах регистрации активности по многим параметрам (например, в журналах безопасности); выявление угроз информационной безопасности на этой основе;
- аналитика из области финансовой разведки.
Анализ больших массивов и потоков текстов (в том числе с большим уровнем шума):
Методы, алгоритмы, инструменты (оригинальные решения, не основанные на классических методах компьютерной лингвистики, без применения лингвистического процессора):
- структурирования: кластеризация (тематическая, сюжетная, ... - под заказанные требования), классификация (в том числе многоуровневая иерархическая со свободной компоновкой подразделов); другие виды сложных кластеризаций и классификаций;
- 2 собственных высокоэффективных метода кластеризации в огромных массивах, (1) в массиве объектов (например, текстов) и (2) в массиве связей между объектами (например, чтобы выявить группы авторов, пишущих на схожие темы);
- экстрагирования знаний: выявление ключевых слов, связок слов, построение аннотаций, сниппетов, дайджестов, более сложных экстрактов текстовых кластеров;
- семантической навигации: поиск похожих текстов, кластеров, предложений и т.д., отправителей сообщений, других элементов семантической сети;
- автоматического построения "смыслоаналоговых рядов" по массиву текстов и одному или нескольким "затравочным" термам (например, по названию города - список городов, по фамилии президента - список президентов и т.п.) - без каких-либо априорных знаний;
- определение автора печатного текста по стилеметрическим признакам;
- разработана технология автоматизации построения онтологий предметной области и компонентов лингво-семантического обеспечения: базовые стратегий, методы, комплекс инструментов высокоэффективной "интеллектуальной" поддержки деятельности эксперта.
Решения в области анализа текстов обладают несколько иным набором характеристик, чем основанные на лингвистическом процессоре (высокая скорость, нечувствительность к лингвистической корректности, любой язык, ...).
Разработана технология создания баз знаний и различных приложений, основанных на базах знаний, в том числе обучающих.
Хороший опыт проектирования мониторинговых систем, в том числе корпоративных.
Создан язык программирования XPL, очень удобный и высокоэффективный для проектирования сложных динамических веб-приложений.
Разработана уникальная платформа обучающих систем на основе баз знаний. Многоцелевая платформа и учебные комплексы по 15 предметам, созданные на основе нашей технологии баз знаний были поставлены во все школы Беларуси, отдельные комплексы, в том числе "Русский язык", продавались в Москве и Санкт-Петербурге.
С февраля 2009 года - сотрудничество с московской компанией и разработки в области информационной аналитики, о которых сказано выше
Распознавание образов, в том числе изображений, текста, рукописных символов, исследования почерка и подписи.
Проработка в ряде проектов и защита кандидатской диссертации «Контекстная поддержка в системах понимания документов».
Разработка контекстных моделей естественного языка (учёная степень присуждена в том числе за метод синтеза таких моделей).
Логическое проектирование. Применение информационно-теоретического метода к синтезу реализаций логических функций, схем, СБИС. Много публикаций на эту тему, преимущественно международных, на английском языке.
Разработка метода анализа и оптимизации на основе теории информации (написал книгу по этим своим разработкам).
Разработка обучающих систем.
Участие в международных конференциях, трёхмесячная работа по гранту в университете в Германии.
Аспирантура
Кандидат наук, диссертация "Контекстная поддержка в системах понимания документов"
Инженер-системотехник
Красный диплом