Многоязычный Яндекс

отметили
2
человека
в архиве
На сегодняшний день в индексной базе Яндекса — 2 976 732 307 веб-страницы.

Что интересно. В базе множество сайтов не русскоязычных (а также не украинских и не белорусских).
К примеру, такой расклад по некоторым зонам:

Доменная зона Франции (.FR) — страниц — 16 982, сайтов — не менее 1 702
rhost="fr*"

Доменная зона Германии (.DE) — страниц — 3 571 911, сайтов — не менее 7 838
rhost="de*"

Доменная зона Китая (.CN) — страниц — 251 430, сайтов — не менее 2 504
rhost="cn*"

Далее приводить не стану, понятно что не русскоязычных страниц в индексе хватает.

Но вот какой вопрос. Зачем бот-индексатор всё это кушает?
Вероятно он переходит по ссылкам с наших сайтов на эти сайты и индексирует их. Зачем же он это делает? Можно предположить что бот этот очень любопытный и стремится к изучению языков, но ведь собрать то он собрал все эти иноземные паги, но язык то так и не понимает. И ведь что то в выдаче по запросам есть, но кэш пустой (посмотрите кэш любой страницы ну хоть на китайском), однако в кэше есть русский, украинский и белорусский (что неудивительно).

А теперь попробуйте добавить китайскую пагу в AddURL.
Что, не кушает? :)
Добавил jED jED 5 Сентября 2007
проблема (2)
Комментарии участников:
Ни одного комментария пока не добавлено


Войдите или станьте участником, чтобы комментировать