Разработчик метрик поискового робота

Местоположение и тип занятости

Минск (Беларусь)Полный рабочий день

Компания

Компания, которая развивает самую популярную в России поисковую систему и десятки других сервисов

Описание вакансии

Условия работы

Поисковый робот Яндекса (контент-система поиска) находит в интернете документы, скачивает их, складывает в хранилище, индексирует и обновляет поисковую базу. Как всякому сложному комплексу, поисковому роботу нужны приборы, позволяющие понять, насколько хорошо он выполняет свои задачи.
Наша группа придумывает и создаёт такие приборы и метрики. И мы ищем единомышленника. Ему предстоит не только разрабатывать новые метрики, но и порой придумывать, как бы мог работать идеальный поисковый робот и как можно было бы измерить наше отставание от идеала.
Вот лишь немногие из вопросов, на которые могут ответить уже созданные нами метрики:
Какую часть «ценных» документов робот доносит до поискового индекса?
Куда и почему пропадает остальная часть?
Как быстро робот находит новые документы?
Насколько хорошо мы выделяем полезные данные из документа?
Наш будущий коллега сможет внести свой вклад в улучшение механизмов подготовки поискового индекса и узнает всё о глубинных процессах, происходящий в каждой из его частей — планировщике скачивания, «качалке», хранилище, индексаторах документов, генераторе индекса и других.
Требования:

опыт разработки на C++;
умение работать в условиях неопределённости (ведь метрики нужно не только разрабатывать, но и придумывать);
желание и умение с нуля делать прототипы для проверки идей.
Плюсами будут:

опыт разработки на C++11/14;
опыт разработки на Python.