Комментарии участников:
Интересная статья, спасибо. Действительно немного наивно расчитывать остаться анонимным и тусить при этом в социальных сетях, пусть даже и закрытых :) Вычислить необходимого тебе кадра, используя их методику, вполне реально и самому.
Знакомая работа. Последнее время вообще участились работы по попылке де-анонимизировать информацию. Была еще статья о том как предсказать Social Security Number (типа, номер пасспорта) исходя из минимума личных данных.
уже есть разработки которые позволяют по фрагментам текста определить автора. информацию об этом ранее можно было найти в гугле, сейчас уже нет — походу засекретили.
не не =) алгоритмы понятны. один из университетов насколько я помню разработал готовую систему, которую можно было даже скачать, что то вроде студенческой курсовой или может чья-то научная работа.
Есть несколько бесплатных пакетов для natural language processing. Уж не упомню названий. Правда, они больше ориентированы на разбивку текста на токены и их классификацию ( по частям речи, соотношения между ними, роль в предложении и т.п.). Думаю, идентификация авторов была основана на этом.
Кстати, многие из этих разработак таки спонсируются американским правительством. Поэтому последнии годы они стали поддерживать арабаский и китайские языки.
Кстати, многие из этих разработак таки спонсируются американским правительством. Поэтому последнии годы они стали поддерживать арабаский и китайские языки.
А какая сеть не является анонимной? Есть форумы и имиджборды, но там, вроде, нет связей между пользователями.
По-моему, настоящие американские учёные Арвинд Нарайянан и Виталий Шматиков совершили открытие в стиле "Если на небе тучи, то вероятность дождя резко повышается".
По-моему, настоящие американские учёные Арвинд Нарайянан и Виталий Шматиков совершили открытие в стиле "Если на небе тучи, то вероятность дождя резко повышается".
Идея то их не сложна и каждому понятно что она работает. Должна работать.Но они певые кто засучили рукава и таки применили ее на практике.
У этой тематики серьезные аспекты. Те кто работают с такого рода сетями попадают под юрисдикцию IRB — комиссий обязаных гарантировать права испытуемых. Так как информированое согласие со всех получить не реально, то данные анонимизируют и считается что пользователи обезопасены. Теперь, когда (далеко не вдруг, вы правы) оказалось что многих можно идентицировать, все возможно, сильно усложнится.
У этой тематики серьезные аспекты. Те кто работают с такого рода сетями попадают под юрисдикцию IRB — комиссий обязаных гарантировать права испытуемых. Так как информированое согласие со всех получить не реально, то данные анонимизируют и считается что пользователи обезопасены. Теперь, когда (далеко не вдруг, вы правы) оказалось что многих можно идентицировать, все возможно, сильно усложнится.
Лев хорошо все объяснил. Макс, я думаю речь идет о пользователях, которые зарегены в этих сетях, под каким-нибудь левым ником и без личных данных, уповая при этом остаться анонимным. Ученые показали, что по структуре их свзяей их несложно вычислить. Согласен с тобой и Львом, что идея-то очевидная.
Поддержу Макса.
ученые взяли две открытых сети — пользователей которые осознанно участвуют в сетях не анонимно.
такие "законопослушные" пользователи не парятся на тему собственной идентификации и в естественном порядке воспроизводят свой круг общения.
если же предположить что пользовательхочет анонимности — то надо понимать что своих "друзей" по другим сетям он вряд ли будет "френдить".
я думаю если бы исследователи провели эксперимент на настоящих анонимах — они бы получили обратный результат — угадывание в 10% случаев.
ученые взяли две открытых сети — пользователей которые осознанно участвуют в сетях не анонимно.
такие "законопослушные" пользователи не парятся на тему собственной идентификации и в естественном порядке воспроизводят свой круг общения.
сделали вид, что пользователи первой из них являются анонимными
если же предположить что пользовательхочет анонимности — то надо понимать что своих "друзей" по другим сетям он вряд ли будет "френдить".
я думаю если бы исследователи провели эксперимент на настоящих анонимах — они бы получили обратный результат — угадывание в 10% случаев.
вот если бы они по контактам в аське начали вычислять — там бы все заработало имхо.
взаимопересечение IM должно быть раза в 3 выше чем у соцсетей. имхо.
взаимопересечение IM должно быть раза в 3 выше чем у соцсетей. имхо.
Аська? Что это такое? На западе ей очень мало кто пользуется.
Если серьезней, то проблема IM в том что сеть невозможно стянуть из интернета crawlerом. Надо получить из компании. И тут анонимность вообще очень болезненая тема. Т.е. ни одна компания не раскроет вам имена реальных пользователей предоставляя вам логи их активности. И правильно сделает.
Если серьезней, то проблема IM в том что сеть невозможно стянуть из интернета crawlerом. Надо получить из компании. И тут анонимность вообще очень болезненая тема. Т.е. ни одна компания не раскроет вам имена реальных пользователей предоставляя вам логи их активности. И правильно сделает.
Вы правы: это были не партизаны из СНГ, а игра в прятки застенчивых иностранцев.
Разбитых серверов и набитых морд не было? Не было. Сети не разорваны, экспериментаторы не отвлекались на вопросы собственного выживания, не… не наши.
Разбитых серверов и набитых морд не было? Не было. Сети не разорваны, экспериментаторы не отвлекались на вопросы собственного выживания, не… не наши.
ученые взяли две открытых сети — пользователей которые осознанно участвуют в сетях не анонимно.
Верно, но вся суть именно в том что они анонимизировали одну из сетей и пользуясь второй восстановили имена многих пользователей. После чего, проверили верно-ли восстановили. Революция? Нет. Но имеет колоссальное принципиальное значение. Как прецендент. Я писал сверху почему.
Кроме того, есть и практичное значение. Одна из серьезных проблем соц. сетей сегодня — их разрозненость. Каждый сидит в 10 сетях и имеет разные (хотя зачастую и пересекающиеся) сферы общения. Многие пытаются надстроить общую сеть, объединить все "кусочки" вместе. В этом смысл и OpenID и Facebook connect и еще десятка схожих технологий. Они предлагают способ этому посодействовать. Опять-же, не революция. Но и не из пальца высосано.
Как все сложно. Просто берешь вирус, закидываешь, и все. Еще можно просто стать "другом" в соц. сети.
Неужели существовала такая проблема… Социальная сеть — сама в сетях интернета, а сети интернета опять же в сети.
Может быть связка Flickr — Twitter и будет работать на 12% погрешости. Зато Макс прав на 100%, упомянув
имиджборды. Например какой-нибудь нульч если и связан с форчаном, то настолько КОСВЕННО, что как там по такой схеме анонимизировать кого, я без малейшего понятия.

Я, к сожалению, не осилю математический текст на английском, но так, как это описано по-русски, то исследование имеет смысл только в том, что доказывает тот факт, что при определенных условиях анонимные пользователи могут быть легко деанонимизированы.
определенныt условия это я так понимаю:
существуют связи, которые также доступны сторонним наблюдателям.