Директор поисковых проектов Mail.ru дал интервью "О настоящем и будущем поисковых технологий, качестве поиска и многом другом"

отметили
18
человек
в архиве
Директор поисковых проектов Mail.ru дал интервью "О настоящем и будущем поисковых технологий, качестве поиска и многом другом"
Каковы особенности индексирования, поиска и ранжирования нетекстовых форматов – изображений, аудио, видео, архивов? Как скоро можно ожидать технологии распознавания мультимедийного контента, или его так и будут всегда ранжировать по текстовым комментариям?

Особенностей много. Очень мало, как правило, текстовой информации, относящейся к объекту поиска. Другие чем в текстовом поиске запросы, большинство из них относятся к небольшому количеству тематических групп. Другие критерии оценки качества контента. Практически полное отсутствие спама на данный момент.

А самое сложное здесь это попытки что-то «добыть» из самого мультимедийного контента, не распознавание даже, а просто извлечение хотя бы какой-то реально полезной информации. Полноценное же распознавание — это вопрос не ближайшего будущего.

С чем, по Вашему мнению, связан рост доли Google в Рунете? У них действительно поиск качественнее, чем у рунетовских систем?

Рост доли Google, без сомнения, связан с качеством, в частности с проделанной в компании работой над спецификой русскоязычного поиска. Но при этом мне совсем не кажется, что Google навсегда застолбил за собой место самого качественного поисковика в Рунете.

Существует конспирологическая теория, что владельцы поисковых систем целенаправленно сдерживают развитие качества поиска, чтобы более активно зарабатывать на контекстной рекламе. Как Вы к этой теории относитесь?

Конечно же, это не так. Выиграв у конкурентов в качестве поиска, можно заработать гораздо больше.

Правда ли, что время традиционного полнотекстового поиска кончается? Каким будет новое поколение: тематические поисковики, вертикальный поиск, экспертный поиск с участием людей?

Мне кажется, что полнотекстовый поиск сохранит свое значение, но будет постепенно эволюционировать, интегрируя в себя в том или ином виде перечисленные в вопросе и некоторые другие тенденции.

Возможно ли в наше время бессылочное поисковое ранжирование? Некоммерческие сайты ссылаются друг на друга достаточно хаотично, а коммерческие – только за деньги. Может, более качественным был бы поиск на основе алгоритма доверия а-ля Trust Rank?

Исключать какую-то информацию из рассмотрения при ранжировании — это принципиально неверный подход. Работать со ссылками нужно обязательно. Конечно, поисковая система должна при этом учитывать существующие реалии и понимать, что не все ссылки одинаковы, и что речь идет не только о количественных (разный вес), но и о качественных различиях. Мы применяем в GoGo.Ru как ссылочное ранжирование, так и альтернативные технологии, и убеждены, что они должны дополнять друг друга.
Добавил Lutcher Lutcher 21 Ноября 2008
Комментарии участников:
Ни одного комментария пока не добавлено


Войдите или станьте участником, чтобы комментировать