Обо мне

Специализация и профессиональные навыки:
Основная область интересов:
• Information retrieval, полнотекстовый поиск, создание эффективных алгоритмов ранжирования.
• Machine learning.
• Управление проектами, связанными с информационным поиском.

Также в разное время занимался следующими задачами:
• Извлечение фактов из неструктурированных текстов (парсер резюме Resumagic);
• Морфологический и синтаксический анализ, выделение именных групп из текстов на естественном языке;
• Автоматическая классификация текстов;
• Обнаружение нечетких дубликатов документов;
• Кластеризация текстов;
• Беспотерьное сжатие данных (в частности, своя реализация LZ-алгоритма, сравнимая по эффективности с LZMA);
• Демомейкинг для ZX Spectrum.

Профессиональные цели:
Больше релевантности. Еще больше.

Награды, сертификаты, портфолио, проекты:
Принимаю участие в различных конкурсах по машинному обучению. Максимальная позиция в общем рейтинге kaggle - 54 место (http://www.kaggle.com/users/11752/alsafr). Как правило, в конкурсах использую свою реализацию алгоритма Gradient Boosted Regression Trees / TreeNet.
• Интернет-турнир Тинькофф Кредитные Системы. Скоринговая задача (предсказание просрочек по кредиту).
  http://www.tcsbank.ru/tournament
  1-е место.
• Конкурс Интернет-Математика 2012. Предсказание переключения на другую поисковую машину по данным поисковых сессий пользователей.
  http://switchdetect.yandex.ru/results_final
  10-е место из 99.
• KDD Cup 2012, Track 2. Предсказание CTR для контекстных объявлений на основе текста объявлений и других факторов.
  http://www.kddcup2012.org/c/kddcup2012-track2/leaderboard
  10-е место из 170.
• Automated Essay Scoring. Автоматическая оценка англоязычных школьных/студенческих сочинений.
  http://www.kaggle.com/c/asap-aes/leaderboard
  7-е место из 156.
• Конкурс Интернет-математика 2011. Предсказание релевантности документов по пользовательскому поведению (поисковым сессиям).
  http://imat-relpred.yandex.ru/results
  3-е место из 101.
• Конкурс Интернет-математика 2009. Предсказание релевантности по набору готовых факторов.
  http://imat2009.yandex.ru/results

Дополнительная информация:
Публикации:
• Яндекс на РОМИП-2010. Тестирование простой ранжирующей формулы.
  http://romip.ru/romip2010/09_yandex_adhoc.pdf
• HeadHunter на РОМИП-2009.
  http://romip.ru/romip2009/05_hh.pdf
• HeadHunter на РОМИП-2008.
  http://romip.ru/romip2008/2008_03_headhunter.pdf
• Resumagic: система автоматической обработки резюме.
  http://rcdl2008.jinr.ru/pdf/184_188_paper21.pdf

Профессиональные навыки
Опыт работы
Крупнейшая российская поисковая система и портал. Яндекс есть также в Казахстане, Беларуси и Турции.
Руководитель службы релевантности и лингвистики
Декабрь 2014 — По настоящее время (5 лет и 10 месяцев)
Разработчик
Апрель 2010 — По настоящее время (10 лет и 6 месяцев)
Обязанности: - Исследования, связанные с текстовым и ссылочным ранжированием. - Разработка и внедрение факторов, улучшающих ранжирование в web-поиске. Достижения: - NDA - NDA - NDA
Высоконагруженный сервис по поиску работы и новых сотрудников
Менеджер поисковой платформы
Май 2008 — Апрель 2010 (2 года)
Обязанности: - Развитие поисковых сервисов. Достижения: - Использование синонимов в поиске вакансий и резюме (http://www.webplanet.ru/news/service/2008/12/18/hh_search.html); - Поиск похожих вакансий и резюме (http://kazan.hh.ru/news/526/); - Рейтинг кадровых агентств (http://hh.ru/article.xml?articleId=1062); - Выпадающие подсказки (suggest) в поисковой строке.
Руководитель проекта
Январь 2006 — Май 2008 (2 года и 5 месяцев)
Обязанности: - Разработка системы для автоматической обработки резюме Resumagic (http://resumagic.ru). - Участие в разработке системы распознавания вакансий для сайта 100 Работ (http://100rabot.ru). - Помощь в разработке проекта HH::Office (http://hhoffice.ru).
KeyStaff Solutions
Москва
Ведущий разработчик, совладелец
Январь 2005 — Декабрь 2005 (1 год)
Обязанности: - Разработка информационных систем для кадровых агентств - Проектирование и разработка парсера резюме. Фактически, тогда это был один из первых парсеров резюме, и, пожалуй, единственный парсер, обеспечивающий приличное качество распознавания. Достижения: - Компания куплена Хэдхантером (http://planetahr.ru/publication/587).