Поисковик Яндекс действительно может найти все! / news2.ru

Поисковик Яндекс действительно может найти все!

отметили

человек

в архиве

Поисковик Яндекс действительно может найти все!

В этот раз в поиске отказались блинки электронных билетов, ФИО, номера паспортов и другие персональные данные путешественников.

Источник:

securitylab.ru/news/406491.php

Добавил

Gig 26 Июля 2011

яндекс, утечка

26 комментариев

проблема (7)

Комментарии участников:

vot, 26 Июля 2011 , url

Наверно, выражу общее мнение — заебали уже псевдо-новостями. Поисковик индексирует то, что находит и что ему позволяют индексировать. Еще раз сошлюсь на механизмы работы с поисковыми машинами — http://robotstxt.org.ru/. Все эти утечки персональных данных — вина разработчиков и администраторов ресурсов, на которые эти данные попадают от самих пользователей. Яндекс, кстати, как и Гугл и другие, отношения ко всему этому не имеют.
Новость — спам.

nobody0, 26 Июля 2011 , url

тут можно попенять только на вашу неосведомленность.

пример, для того, чтобы лучше разбираться в технологиях. =)

leprosorium.ru/robots.txt — таким он был всегда потому как сообщество закрытое.

а теперь смотрим выдачу

yandex.ru/yandsearch?serverurl=leprosorium.ru&lr=2

Собираем майлы пользователей с установленным яндекс баром. =))))

Для того чтобы не быть голословным цитата и сегодняшних пояснялок от яндекса:

В браузер могут быть встроены и другие плагины. Например, Яндекс.Бар или Google.Бар показывают ранг страницы, для чего передают ее адрес на сервер.

Еще вопросы есть?

-1

vot, 26 Июля 2011 , url

Отвечаю последний раз, простите, но времени копировать строчки с ресурса, на который я уже 10-й раз ссылаюсь, нет…

Файл robots.txt – это текстовый файл, находящийся в корневой директории сайта, в котором записываются специальные инструкции для поисковых роботов. Эти инструкции могут запрещать к индексации некоторые разделы или страницы на сайте, указывать на правильное «зеркалирование» домена, рекомендовать поисковому роботу соблюдать определенный временной интервал между скачиванием документов с сервера и т.д.

http://robotstxt.org.ru/

nobody0, 26 Июля 2011 , url

простите вы бот?

По ссылкам ходить умеете?

Фаил роботс, даже правильно оформленный, ничего не запрещает (!) он лишь дает указание поисковым роботам по возможности не добавлять в индекс определенную информацию. Бот индексатор все равно пройдет по всем доступным страницам — программа у него такая.

Читайте логи серверов, если знаете, что это такое и посмотрите, что и откуда запрашивается ботами. =)

nobody0, 26 Июля 2011 , url

Забыл ссылку на цитату:

my.yandex.ru/webmaster/replies.xml?item_no=10941

-1

vot, 26 Июля 2011 , url

клевая ссылка. Тулы я уже вспоминал. И че?

-1

Fduch, 27 Июля 2011 , url

а теперь смотрим выдачу
yandex.ru/yandsearch?serverurl=leprosorium.ru&lr=2

Что Вы хотели этим сказать?

Область поиска: сайт — leprosorium.ru
Искомая комбинация слов нигде не встречается.

nobody0, 27 Июля 2011 , url

ловить вчерашний день пришли?

forum.searchengines.ru/forumdisplay.php?f=60

Сегодня с утра был апдейт и данные убраны.

-3

Gig, 26 Июля 2011 , url

Вопрос не что он находит а как он находит. Эти данные можно получить только используя «следящее» ПО.
К тому же это прямое нарушение приватности, виноваты все

vot, 26 Июля 2011 , url

Этот ответ таков: файл robots.txt не предназначен для контроля доступа и не должен для него использоваться. Рассматривайте его не как замок на двери, а как табличку «не входить». Если доступ к определенным файлам на сервере нужно ограничить – используйте систему авторизации доступа. Поддержка Basic Authentication появилась в веб-серверах еще на заре веб (например, она очень просто настраивается на Apache), а если вам нужно что-то посерьезнее, используйте SSL.

http://robotstxt.org.ru/chavo#robots.txt_

Следящее ПО, блять… Работать надо грамотно, просто… Не заставляйте материться… Меньше всего тому же Яндексу нужно это — индексировать какие-то пользовательские данные. А с теориями заговоров, идите к психологу. Все как всегда проще — никто ничего тайного не придумывал, просто посадили студента и он напипячил, а теперь Яндексу нужно объяснять, как так получилось, что где-то там студенту дали подработать…

-5

Gig, 26 Июля 2011 , url

Комментарий скрыт. Нажмите, чтобы показать.

vot, 26 Июля 2011 , url

Да какая разница?
К примеру это могло бы быть и так (а это, между прочим, прямо из ссылки, что я постил выше):

Кто-то может разместить ссылку на ваши файлы на своем сайте. Или их названия могут появиться в общедоступном лог-файле, например, генерируемом прокси-сервером, через который ходят посетители вашего сайта. Или кто-то может перенастроить сервер, опять сказав ему отдавать список файлов в директории.

Есть особенности реализации индексирования в разных системах. Тут много писали о всевозможных тулах. Но сути этого не меняет — это не поисковик ищет слишком хорошо, это ребята не дали понять поисковику, что ему стоит индексировать, а что нет.

-2

Gig, 26 Июля 2011 , url

Просто яндекс попал в некрасивую ситуацию — его сервисы работают как шпионское ПО, признавать они это не хотят, поэтому всеми силами перекладывают вину на владельцев веб сайтов.

vot, 26 Июля 2011 , url

Так, давайте по порядку. По вашему проблема не в том, что данные попали на индексацию, а в том, как именно их собрал поисковик?

-2

Gig, 26 Июля 2011 , url

По мойму виноваты оба как владельцы сайта так и яндекс. Только яндекс не хочет признавать пробему и сваливает все на владельцев веб сайтов.

vot, 26 Июля 2011 , url

В чем виноват Яндекс? И почему, только Яндекс?
И вы на вопрос не ответили, вас реально беспокоит не индексация пользовательских данных, а только методы сбора информации поисковиками?

comander, 26 Июля 2011 , url

ваще то яндексу должно было прийти в голову что паспортные данные буде таковые найдутся надо из базы выпиливать. может закон свежий на эту мысль натолкнет. посмотрим.

vot, 26 Июля 2011 , url

слишком много ньюансов с реализацией самой идеи и со смежными: типа, а если специально постили (потеряли паспорт), что делать с номерами страховки, и т.д. где ограничивать. + дело, как я уже говорил, не в Яндексе, то же надо применять ко всем поисковикам. А это выработка нового протокола-стандарта, причем общемирового. Причем по весьма аморфным критериям. Кажется, идея весьма бесперспективной.

comander, 26 Июля 2011 , url

это так кажется до первого хорошего суда ) Мегафон тоже не видел технической возможности траффик в роуминге билить ;)

vot, 26 Июля 2011 , url

Не, это сильно разные вещи. Я бы сказал, не сопоставимо разные. Тут с любой точки зрения — проблема в недоработке администраторов и разработчиков этих «проблемных» ресурсов.

comander, 26 Июля 2011 , url

идешь по дороге находишь паспорт. ксеришь его и развешиваешь по всем углам, ну работа у тебя такая — ксерить и объявы вешать…
потом по этому паспорту берут пару лямов кредита… соучастник ты или просто у тебя так робот работает? )

vot, 26 Июля 2011 , url

Не буду дальше спорить, аналогия не корректна… Просто есть стандарт работы с поисковиками, и тут он нарушен. Не со стороны поисковика, а со стороны администраторов ресурса.
Если более верную аналогию придумать, это будет так: у вас есть окно, через которое вас видят. И вы знаете, что нужно не ходить голым перед этим окном. А тут вы вышли голым (по незнанию, как окно работает или просто забыли одеться) и случился конфуз. Глупо в это винить производителей окон, как вам кажется?

comander, 26 Июля 2011 , url

окна то тут особо не причем… а вот гугломобиль который как раз занимался «подглядыванием» — пару скандалов инициировал.

Fduch, 27 Июля 2011 , url

паспортные данные буде таковые найдутся надо из базы выпиливать

Я думаю, если Вы научитесь хорошо и быстро определять (программно) наличие паспортных данных в документе, Вас позьмут работать в Яндекс.

manoul.blogspot.com, 26 Июля 2011 , url

С вашей логикой получается, что женщины виноваты, что на них маньяки нападают, типа, нечего провоцировать. Смешно.

Jo-Jo, 26 Июля 2011 , url

Войдите или станьте участником, чтобы комментировать

Поисковик Яндекс действительно может найти все!

Вход без регистрации

Для участников

Или войдите через OpenID