Применяю машинное обучение в разных практических областях: рекомендательные системы, распознавание лиц, робототехника (готовка еды), извлечение информации из новостного потока
(Python) Проект Rutube. Разработка сервисов машинного обучения: рекомендательная система (аудио/видео тегирование, NLP, поиск векторов, анализ истории просмотров, персонализированные рекомендации, система ранжирования) и системы модерации контента (автомодерация комментариев, распознавание порно, обнаружение скрытой рекламы, распознавание речи). Порядка 10 из них используются в продуктиве. Руководство 2 людьми.
(C++, Python) Ускорение рекуррентного слоя в пайплайне распознавания текста.
Причина перехода: в отношении моей работы не было отрицательных комментариев во время испытательного срока, в основном финансовое решение
(Python) Занимался тематиками дистилляции датасета и дистилляции знаний в проекте по распознаванию лиц.
Причина перехода: другая компания предложила лучшие условия, работодатель согласился с моим переходом
(Python) Применял машинное обучение (нейросети) для автоматизации роботов, готовящих еду. В основном работал в области компьютерного зрения над захватом объектов, связанных с едой.
Причина перехода: компания переехала в Барселону
Исследовал тематику анализа устройства мозга человека для построения систем вычисления. Анализировал, каким образом можно использовать базу знаний об автомобильных авариях для обеспечения безопасности беспилотного автомобиля.
(Python, Java, C++). Применял нейросети и машинное обучение для проектов, связанных с рекомендациями на телефоне рецептов корейской еды, видео, фильтрацией ненормативного контента, анализом демографического профиля пользователя. Также работал над автоматическим реферированием новостей и электронных писем.
Патенты:
[1]
Maslennikov, M. 2016. Способ суммаризации текста
и используемые для его реализации
устройство и машиночитаемый носитель
информации. // Заявка №301553RU. 2015
[2] Казанцев А.Ю., Крыжановский К.А., Масленников М.В., Подойницина Л.В., Полуботко Д.В., Романенко А.С. Способ определения профиля пользователя мобильного устройства на самом мобильном устройстве и система демографического профилирования. // Заявка No301620RU. 2016.
Создал и преподавал спецкурс “Математические методы анализа текстов” на факультете ВМК МГУ, состоящий из ~60 лекций, в частности по тематикам машинного обучения и нейросетей, компьютерной лингвистики. На нём сделаны полностью бесплатные корпуса и С++ парсеры (зависимостный, семантический, дискурсивный, анафорический, собственных имён) и прочие задачи. Сайт спецкурса vk.com/mathtexts, github.com/mathtexts.
(Java, Python) Работал над различными задачами, связанными с извлечением информации из текста: инфраструктура для статистического обучения, самозагрузочная система, морфологический анализ, анализ композитных слов, парсинг веб-страниц во фреймы для извлечения информации.
Готовил тьюториалы для студентов курса по Natural Language Toolkit, решил ~150 задач из книги по NLTK и проверял решения ~30 студентов. Также, исследовал обработку оценочных вопросов в вопросно-ответных системах.
(Python) Помогал двум PhD студентам по тематике анализа мнений и вопросно-ответным системам. Создал систему для глубокого сравнения событий в новостях с использованием Categorial Combinatory Analysis. Работал над построением самообучаемой системы извлечения информации из текстов.
(Perl) Исследования в рамках PhD программы по тематике Information Extraction from Free Text. Реализовал систему ARE, комбинирующую зависимостный, семантический и дискурсивный уровни анализа текстов.
(Perl, C++) Стажировка для дипломированных специалистов. Создал систему для извлечения собственных имён из текстов на естественном языке для соревнования вопросно-ответных систем TREC.
(Pascal/Delphi). Программировал интерфейс для национального проекта управлением энергосистемами.
(C++, Delphi, COM). Проект NetPumper. Создал программный интерфейс и интегрировал его с браузерами (перехватывал клики пользователей). >5800000 пользователей, 7я по популярности программа в 2002 году согласно download.com.
(Pascal, Delphi). Проект Chess Assistant, программа для подготовки шахматистов. Создал систему для автоматического подсчёта шахматных рейтингов, создал информационные фильмы, создал систему для предотвращения использования шахматных программ игроками во время соревнований в режиме онлайн.
Степень Ph.D. (Computational Linguistics)
Руководители:
Prof. Tat-Seng Chua, Prof. Tian Qi
Основные публикации:
[1] Maslennikov, M., and T.S. Chua. 2008.
Combining Relations for Information Extraction from Free Text.
Transactions in Information Systems.
[2]
Maslennikov, M. 2008. Relation
Extraction for Information Extraction from Free Text.
PhD Thesis, National University of Singapore.
[3]
Maslennikov, M. and Chua, T.S. 2007. A
Multi-resolution Framework for Information Extraction from Free Text.
In Proc of ACL.
[4] Maslennikov, M., Goh, H.K. and Chua, T.S. 2006. ARE: Instance Splitting Strategies for Dependency Relation-based Information Extraction. In Proc of ACL.
Публикации:
[1] Maslennikov, M. 2005. The Use of Relations in
Information Extraction from Free-Text. Thesis
proposal.
[2]
Maslennikov, M., Goh, H.K. and Chua, T.S. 2005. HERCULES:
Bootstrapping Rules for Free Text Information Extraction.
Internal report.
[3]
Maslennikov, M. 2004. Exploiting Cross Domain Rule Sets as External
Resources of Knowledge for Text Processing. Term
paper.
[4]
Yang, H., Cui, H., Kan, M.Y., Maslennikov, M., Qiu, L. and Chua, T.S.
2003. QUALIFIER in TREC-12 QA main task. Notebook
of the 12th Text Retrieval Conference
(TREC 2003), Maryland, USA
5-летний диплом (математик, системный программист)
Руководители: проф. Владимир Сухомлин, н.с. Дмитрий Гурьев