Многоязычный Яндекс
отметили
2
человека
в архиве
На сегодняшний день в индексной базе Яндекса — 2 976 732 307 веб-страницы.
Что интересно. В базе множество сайтов не русскоязычных (а также не украинских и не белорусских).
К примеру, такой расклад по некоторым зонам:
Доменная зона Франции (.FR) — страниц — 16 982, сайтов — не менее 1 702
rhost="fr*"
Доменная зона Германии (.DE) — страниц — 3 571 911, сайтов — не менее 7 838
rhost="de*"
Доменная зона Китая (.CN) — страниц — 251 430, сайтов — не менее 2 504
rhost="cn*"
Далее приводить не стану, понятно что не русскоязычных страниц в индексе хватает.
Но вот какой вопрос. Зачем бот-индексатор всё это кушает?
Вероятно он переходит по ссылкам с наших сайтов на эти сайты и индексирует их. Зачем же он это делает? Можно предположить что бот этот очень любопытный и стремится к изучению языков, но ведь собрать то он собрал все эти иноземные паги, но язык то так и не понимает. И ведь что то в выдаче по запросам есть, но кэш пустой (посмотрите кэш любой страницы ну хоть на китайском), однако в кэше есть русский, украинский и белорусский (что неудивительно).
А теперь попробуйте добавить китайскую пагу в AddURL.
Что, не кушает? :)
Что интересно. В базе множество сайтов не русскоязычных (а также не украинских и не белорусских).
К примеру, такой расклад по некоторым зонам:
Доменная зона Франции (.FR) — страниц — 16 982, сайтов — не менее 1 702
rhost="fr*"
Доменная зона Германии (.DE) — страниц — 3 571 911, сайтов — не менее 7 838
rhost="de*"
Доменная зона Китая (.CN) — страниц — 251 430, сайтов — не менее 2 504
rhost="cn*"
Далее приводить не стану, понятно что не русскоязычных страниц в индексе хватает.
Но вот какой вопрос. Зачем бот-индексатор всё это кушает?
Вероятно он переходит по ссылкам с наших сайтов на эти сайты и индексирует их. Зачем же он это делает? Можно предположить что бот этот очень любопытный и стремится к изучению языков, но ведь собрать то он собрал все эти иноземные паги, но язык то так и не понимает. И ведь что то в выдаче по запросам есть, но кэш пустой (посмотрите кэш любой страницы ну хоть на китайском), однако в кэше есть русский, украинский и белорусский (что неудивительно).
А теперь попробуйте добавить китайскую пагу в AddURL.
Что, не кушает? :)
Добавил
jED 5 Сентября 2007

нет комментариев
проблема (2)
Комментарии участников:
Ни одного комментария пока не добавлено