Ученые создали методику для вычисления анонимных пользователей с помощью социальных сетей

отметили
54
человека
в архиве
Ученые создали методику для вычисления анонимных пользователей с помощью социальных сетей
Исследователи из Техасского университета утверждают, что анонимность, которую предоставляют пользователям социальные сети, зачастую таковой не является. Несмотря на отсутствие идентифицирующих данных (таких как имена, адреса и т.п.), пользователей "выдаёт" сама структура взаимосвязей между ними.

Свою методику кандидат наук Арвинд Нарайянан (Arvind Narayanan) и его куратор Виталий Шматиков (Vitaly Shmatikov), описывают в работе "Деанонимизация социальных сетей". Суть методики заключается в следующем.

Имеется некая социальная сеть анонимных пользователей и имеется другая сеть, пользователи которой легко идентифицируются. Между пользователями обеих сетей существуют связи, которые также доступны сторонним наблюдателям. Имея в распоряжении лишь эти данные, Нарайянан и Шматиков могут вычислить интернетчиков, которые являются участниками обеих сетей, и, таким образом, идентифицировать "анонимных" юзеров первой сети.

В качестве примера исследователи взяли две крупные социальные сети, Twitter и Flickr, сделали вид, что пользователи первой из них являются анонимными, и применили к ним свою методику. После этого они проверили правильность полученных результатов, что несложно было сделать, поскольку Twitter всё-таки является публичной сетью.

Выяснилось, что треть пользователей, идентификацию которых можно проверить и которые при этом являются членами как Twitter, так и Flickr, опознаются с высокой степенью вероятности. Погрешность составила всего 12%, и это притом что связи между пользователями обеих сетей заметно отличаются (перекрытие составляет менее 15%).

Нарайянан и Шматиков считают, что "в случае с социальными сетями анонимность не является достаточным условием для сохранения прайвэси". Также исследователи отмечают, что не видят никакого технического решения, которое могло бы защитить анонимность пользователей социальных сетей.
Добавил ramelito ramelito 5 Апреля 2009
проблема (1)
Комментарии участников:
Mindwork
+3
Mindwork, 5 Апреля 2009 , url
Интересная статья, спасибо. Действительно немного наивно расчитывать остаться анонимным и тусить при этом в социальных сетях, пусть даже и закрытых :) Вычислить необходимого тебе кадра, используя их методику, вполне реально и самому.
LevM
+3
LevM, 5 Апреля 2009 , url
Знакомая работа. Последнее время вообще участились работы по попылке де-анонимизировать информацию. Была еще статья о том как предсказать Social Security Number (типа, номер пасспорта) исходя из минимума личных данных.
fakenews
0
fakenews, 6 Апреля 2009 , url
уже есть разработки которые позволяют по фрагментам текста определить автора. информацию об этом ранее можно было найти в гугле, сейчас уже нет — походу засекретили.
LevM
0
LevM, 6 Апреля 2009 , url
Не, не засекретили ;) Это общедоступные публикации. Проверьте stemming algorithms.
fakenews
0
fakenews, 6 Апреля 2009 , url
не не =) алгоритмы понятны. один из университетов насколько я помню разработал готовую систему, которую можно было даже скачать, что то вроде студенческой курсовой или может чья-то научная работа.
LevM
0
LevM, 6 Апреля 2009 , url
Есть несколько бесплатных пакетов для natural language processing. Уж не упомню названий. Правда, они больше ориентированы на разбивку текста на токены и их классификацию ( по частям речи, соотношения между ними, роль в предложении и т.п.). Думаю, идентификация авторов была основана на этом.
Кстати, многие из этих разработак таки спонсируются американским правительством. Поэтому последнии годы они стали поддерживать арабаский и китайские языки.
fakenews
0
fakenews, 6 Апреля 2009 , url
это n-gram анализ. понятно что он использовался, но этого мало для достоверности.
Max Folder
+8
Max Folder, 5 Апреля 2009 , url
А какая сеть не является анонимной? Есть форумы и имиджборды, но там, вроде, нет связей между пользователями.
По-моему, настоящие американские учёные Арвинд Нарайянан и Виталий Шматиков совершили открытие в стиле "Если на небе тучи, то вероятность дождя резко повышается".

LevM
+5
LevM, 5 Апреля 2009 , url
Идея то их не сложна и каждому понятно что она работает. Должна работать.Но они певые кто засучили рукава и таки применили ее на практике.
У этой тематики серьезные аспекты. Те кто работают с такого рода сетями попадают под юрисдикцию IRB — комиссий обязаных гарантировать права испытуемых. Так как информированое согласие со всех получить не реально, то данные анонимизируют и считается что пользователи обезопасены. Теперь, когда (далеко не вдруг, вы правы) оказалось что многих можно идентицировать, все возможно, сильно усложнится.
Mindwork
+2
Mindwork, 5 Апреля 2009 , url
Лев хорошо все объяснил. Макс, я думаю речь идет о пользователях, которые зарегены в этих сетях, под каким-нибудь левым ником и без личных данных, уповая при этом остаться анонимным. Ученые показали, что по структуре их свзяей их несложно вычислить. Согласен с тобой и Львом, что идея-то очевидная.
comander
+1
comander, 6 Апреля 2009 , url
Поддержу Макса.
ученые взяли две открытых сети — пользователей которые осознанно участвуют в сетях не анонимно.
такие "законопослушные" пользователи не парятся на тему собственной идентификации и в естественном порядке воспроизводят свой круг общения.
сделали вид, что пользователи первой из них являются анонимными

если же предположить что пользовательхочет анонимности — то надо понимать что своих "друзей" по другим сетям он вряд ли будет "френдить".
я думаю если бы исследователи провели эксперимент на настоящих анонимах — они бы получили обратный результат — угадывание в 10% случаев.
comander
+1
comander, 6 Апреля 2009 , url
вот если бы они по контактам в аське начали вычислять — там бы все заработало имхо.
взаимопересечение IM должно быть раза в 3 выше чем у соцсетей. имхо.
LevM
0
LevM, 6 Апреля 2009 , url
Аська? Что это такое? На западе ей очень мало кто пользуется.
Если серьезней, то проблема IM в том что сеть невозможно стянуть из интернета crawlerом. Надо получить из компании. И тут анонимность вообще очень болезненая тема. Т.е. ни одна компания не раскроет вам имена реальных пользователей предоставляя вам логи их активности. И правильно сделает.
comander
0
comander, 6 Апреля 2009 , url
и слава богу
precedent
+1
precedent, 6 Апреля 2009 , url
Вы правы: это были не партизаны из СНГ, а игра в прятки застенчивых иностранцев.
Разбитых серверов и набитых морд не было? Не было. Сети не разорваны, экспериментаторы не отвлекались на вопросы собственного выживания, не… не наши.
LevM
+1
LevM, 6 Апреля 2009 , url
ученые взяли две открытых сети — пользователей которые осознанно участвуют в сетях не анонимно.

Верно, но вся суть именно в том что они анонимизировали одну из сетей и пользуясь второй восстановили имена многих пользователей. После чего, проверили верно-ли восстановили. Революция? Нет. Но имеет колоссальное принципиальное значение. Как прецендент. Я писал сверху почему.
Кроме того, есть и практичное значение. Одна из серьезных проблем соц. сетей сегодня — их разрозненость. Каждый сидит в 10 сетях и имеет разные (хотя зачастую и пересекающиеся) сферы общения. Многие пытаются надстроить общую сеть, объединить все "кусочки" вместе. В этом смысл и OpenID и Facebook connect и еще десятка схожих технологий. Они предлагают способ этому посодействовать. Опять-же, не революция. Но и не из пальца высосано.
De-Luxis
+1
De-Luxis, 5 Апреля 2009 , url
Как все сложно. Просто берешь вирус, закидываешь, и все. Еще можно просто стать "другом" в соц. сети.
precedent
0
precedent, 5 Апреля 2009 , url
Неужели существовала такая проблема… Социальная сеть — сама в сетях интернета, а сети интернета опять же в сети.
LevM
+2
LevM, 6 Апреля 2009 , url
Вот вы в сеть и попались. Хрен теперь из этой казуистики выберетесь ;)
precedent
+2
precedent, 6 Апреля 2009 , url
казуистика- моя стихия
LevM
+2
LevM, 6 Апреля 2009 , url
Зато сети — моя ;)
psyhedg
0
psyhedg, 6 Апреля 2009 , url
В доме, который построил Джек.
Netto
0
Netto, 6 Апреля 2009 , url
Может быть связка Flickr — Twitter и будет работать на 12% погрешости. Зато Макс прав на 100%, упомянув имиджборды. Например какой-нибудь нульч если и связан с форчаном, то настолько КОСВЕННО, что как там по такой схеме анонимизировать кого, я без малейшего понятия.
Max Folder
+1
Max Folder, 6 Апреля 2009 , url
Я, к сожалению, не осилю математический текст на английском, но так, как это описано по-русски, то исследование имеет смысл только в том, что доказывает тот факт, что при определенных условиях анонимные пользователи могут быть легко деанонимизированы.
John-Doe
0
John-Doe, 6 Апреля 2009 , url
определенныt условия это я так понимаю:
существуют связи, которые также доступны сторонним наблюдателям.
Max Folder
0
Max Folder, 6 Апреля 2009 , url
Ну да.
Max Folder
0
Max Folder, 6 Апреля 2009 , url
Кстати, я выявил Dreammaker'а на searchengines — у него такой же ник и аватар;-)


Войдите или станьте участником, чтобы комментировать