Поисковик Яндекс действительно может найти все!

отметили
18
человек
в архиве
Поисковик Яндекс действительно может найти все!
В этот раз в поиске отказались блинки электронных билетов, ФИО, номера паспортов и другие персональные данные путешественников.
Добавил Gig Gig 26 Июля 2011
проблема (7)
Комментарии участников:
vot
0
vot, 26 Июля 2011 , url
Наверно, выражу общее мнение — заебали уже псевдо-новостями. Поисковик индексирует то, что находит и что ему позволяют индексировать. Еще раз сошлюсь на механизмы работы с поисковыми машинами — http://robotstxt.org.ru/. Все эти утечки персональных данных — вина разработчиков и администраторов ресурсов, на которые эти данные попадают от самих пользователей. Яндекс, кстати, как и Гугл и другие, отношения ко всему этому не имеют.
Новость — спам.
nobody0
+1
nobody0, 26 Июля 2011 , url
тут можно попенять только на вашу неосведомленность.

пример, для того, чтобы лучше разбираться в технологиях. =)

leprosorium.ru/robots.txt — таким он был всегда потому как сообщество закрытое.

а теперь смотрим выдачу

yandex.ru/yandsearch?serverurl=leprosorium.ru&lr=2

Собираем майлы пользователей с установленным яндекс баром. =))))

Для того чтобы не быть голословным цитата и сегодняшних пояснялок от яндекса:

В браузер могут быть встроены и другие плагины. Например, Яндекс.Бар или Google.Бар показывают ранг страницы, для чего передают ее адрес на сервер.

Еще вопросы есть?
vot
-1
vot, 26 Июля 2011 , url
Отвечаю последний раз, простите, но времени копировать строчки с ресурса, на который я уже 10-й раз ссылаюсь, нет…
Файл robots.txt – это текстовый файл, находящийся в корневой директории сайта, в котором записываются специальные инструкции для поисковых роботов. Эти инструкции могут запрещать к индексации некоторые разделы или страницы на сайте, указывать на правильное «зеркалирование» домена, рекомендовать поисковому роботу соблюдать определенный временной интервал между скачиванием документов с сервера и т.д.
http://robotstxt.org.ru/
nobody0
0
nobody0, 26 Июля 2011 , url
простите вы бот?

По ссылкам ходить умеете?

Фаил роботс, даже правильно оформленный, ничего не запрещает (!) он лишь дает указание поисковым роботам по возможности не добавлять в индекс определенную информацию. Бот индексатор все равно пройдет по всем доступным страницам — программа у него такая.

Читайте логи серверов, если знаете, что это такое и посмотрите, что и откуда запрашивается ботами. =)
nobody0
+1
nobody0, 26 Июля 2011 , url
Забыл ссылку на цитату:
my.yandex.ru/webmaster/replies.xml?item_no=10941
vot
-1
vot, 26 Июля 2011 , url
клевая ссылка. Тулы я уже вспоминал. И че?
Fduch
-1
Fduch, 27 Июля 2011 , url
а теперь смотрим выдачу
yandex.ru/yandsearch?serverurl=leprosorium.ru&lr=2
Что Вы хотели этим сказать?

Область поиска: сайт — leprosorium.ru
Искомая комбинация слов нигде не встречается.
nobody0
0
nobody0, 27 Июля 2011 , url
ловить вчерашний день пришли?

forum.searchengines.ru/forumdisplay.php?f=60

Сегодня с утра был апдейт и данные убраны.
Gig
-3
Gig, 26 Июля 2011 , url
Вопрос не что он находит а как он находит. Эти данные можно получить только используя «следящее» ПО.
К тому же это прямое нарушение приватности, виноваты все
vot
0
vot, 26 Июля 2011 , url
Этот ответ таков: файл robots.txt не предназначен для контроля доступа и не должен для него использоваться. Рассматривайте его не как замок на двери, а как табличку «не входить». Если доступ к определенным файлам на сервере нужно ограничить – используйте систему авторизации доступа. Поддержка Basic Authentication появилась в веб-серверах еще на заре веб (например, она очень просто настраивается на Apache), а если вам нужно что-то посерьезнее, используйте SSL.
http://robotstxt.org.ru/chavo#robots.txt_

Следящее ПО, блять… Работать надо грамотно, просто… Не заставляйте материться… Меньше всего тому же Яндексу нужно это — индексировать какие-то пользовательские данные. А с теориями заговоров, идите к психологу. Все как всегда проще — никто ничего тайного не придумывал, просто посадили студента и он напипячил, а теперь Яндексу нужно объяснять, как так получилось, что где-то там студенту дали подработать…
vot
+2
vot, 26 Июля 2011 , url
Да какая разница?
К примеру это могло бы быть и так (а это, между прочим, прямо из ссылки, что я постил выше):
Кто-то может разместить ссылку на ваши файлы на своем сайте. Или их названия могут появиться в общедоступном лог-файле, например, генерируемом прокси-сервером, через который ходят посетители вашего сайта. Или кто-то может перенастроить сервер, опять сказав ему отдавать список файлов в директории.
Есть особенности реализации индексирования в разных системах. Тут много писали о всевозможных тулах. Но сути этого не меняет — это не поисковик ищет слишком хорошо, это ребята не дали понять поисковику, что ему стоит индексировать, а что нет.
Gig
-2
Gig, 26 Июля 2011 , url
Просто яндекс попал в некрасивую ситуацию — его сервисы работают как шпионское ПО, признавать они это не хотят, поэтому всеми силами перекладывают вину на владельцев веб сайтов.
vot
+1
vot, 26 Июля 2011 , url
Так, давайте по порядку. По вашему проблема не в том, что данные попали на индексацию, а в том, как именно их собрал поисковик?
Gig
-2
Gig, 26 Июля 2011 , url
По мойму виноваты оба как владельцы сайта так и яндекс. Только яндекс не хочет признавать пробему и сваливает все на владельцев веб сайтов.
vot
+1
vot, 26 Июля 2011 , url
В чем виноват Яндекс? И почему, только Яндекс?
И вы на вопрос не ответили, вас реально беспокоит не индексация пользовательских данных, а только методы сбора информации поисковиками?
comander
+1
comander, 26 Июля 2011 , url
ваще то яндексу должно было прийти в голову что паспортные данные буде таковые найдутся надо из базы выпиливать. может закон свежий на эту мысль натолкнет. посмотрим.
vot
0
vot, 26 Июля 2011 , url
слишком много ньюансов с реализацией самой идеи и со смежными: типа, а если специально постили (потеряли паспорт), что делать с номерами страховки, и т.д. где ограничивать. + дело, как я уже говорил, не в Яндексе, то же надо применять ко всем поисковикам. А это выработка нового протокола-стандарта, причем общемирового. Причем по весьма аморфным критериям. Кажется, идея весьма бесперспективной.
comander
+3
comander, 26 Июля 2011 , url
это так кажется до первого хорошего суда ) Мегафон тоже не видел технической возможности траффик в роуминге билить ;)
vot
0
vot, 26 Июля 2011 , url
Не, это сильно разные вещи. Я бы сказал, не сопоставимо разные. Тут с любой точки зрения — проблема в недоработке администраторов и разработчиков этих «проблемных» ресурсов.
comander
+1
comander, 26 Июля 2011 , url
идешь по дороге находишь паспорт. ксеришь его и развешиваешь по всем углам, ну работа у тебя такая — ксерить и объявы вешать…
потом по этому паспорту берут пару лямов кредита… соучастник ты или просто у тебя так робот работает? )
vot
0
vot, 26 Июля 2011 , url
Не буду дальше спорить, аналогия не корректна… Просто есть стандарт работы с поисковиками, и тут он нарушен. Не со стороны поисковика, а со стороны администраторов ресурса.
Если более верную аналогию придумать, это будет так: у вас есть окно, через которое вас видят. И вы знаете, что нужно не ходить голым перед этим окном. А тут вы вышли голым (по незнанию, как окно работает или просто забыли одеться) и случился конфуз. Глупо в это винить производителей окон, как вам кажется?
comander
+1
comander, 26 Июля 2011 , url
окна то тут особо не причем… а вот гугломобиль который как раз занимался «подглядыванием» — пару скандалов инициировал.
Fduch
0
Fduch, 27 Июля 2011 , url
паспортные данные буде таковые найдутся надо из базы выпиливать
Я думаю, если Вы научитесь хорошо и быстро определять (программно) наличие паспортных данных в документе, Вас позьмут работать в Яндекс.
manoul.blogspot.com
+2
manoul.blogspot.com, 26 Июля 2011 , url
С вашей логикой получается, что женщины виноваты, что на них маньяки нападают, типа, нечего провоцировать. Смешно.
Jo-Jo
+2
Jo-Jo, 26 Июля 2011 , url
R


Войдите или станьте участником, чтобы комментировать