Ученые создали методику для вычисления анонимных пользователей с помощью социальных сетей / news2.ru

Ученые создали методику для вычисления анонимных пользователей с помощью социальных сетей

отметили

человека

в архиве

Ученые создали методику для вычисления анонимных пользователей с помощью социальных сетей

Исследователи из Техасского университета утверждают, что анонимность, которую предоставляют пользователям социальные сети, зачастую таковой не является. Несмотря на отсутствие идентифицирующих данных (таких как имена, адреса и т.п.), пользователей "выдаёт" сама структура взаимосвязей между ними.

Свою методику кандидат наук Арвинд Нарайянан (Arvind Narayanan) и его куратор Виталий Шматиков (Vitaly Shmatikov), описывают в работе "Деанонимизация социальных сетей". Суть методики заключается в следующем.

Имеется некая социальная сеть анонимных пользователей и имеется другая сеть, пользователи которой легко идентифицируются. Между пользователями обеих сетей существуют связи, которые также доступны сторонним наблюдателям. Имея в распоряжении лишь эти данные, Нарайянан и Шматиков могут вычислить интернетчиков, которые являются участниками обеих сетей, и, таким образом, идентифицировать "анонимных" юзеров первой сети.

В качестве примера исследователи взяли две крупные социальные сети, Twitter и Flickr, сделали вид, что пользователи первой из них являются анонимными, и применили к ним свою методику. После этого они проверили правильность полученных результатов, что несложно было сделать, поскольку Twitter всё-таки является публичной сетью.

Выяснилось, что треть пользователей, идентификацию которых можно проверить и которые при этом являются членами как Twitter, так и Flickr, опознаются с высокой степенью вероятности. Погрешность составила всего 12%, и это притом что связи между пользователями обеих сетей заметно отличаются (перекрытие составляет менее 15%).

Нарайянан и Шматиков считают, что "в случае с социальными сетями анонимность не является достаточным условием для сохранения прайвэси". Также исследователи отмечают, что не видят никакого технического решения, которое могло бы защитить анонимность пользователей социальных сетей.

Источник:

securitylab.ru/news/376934.php

Добавил

ramelito 5 Апреля 2009

сеть, анонимность, пользователь, методика, социальный, исследователь, анонимный

27 комментариев

проблема (1)

Комментарии участников:

Mindwork, 5 Апреля 2009 , url

Интересная статья, спасибо. Действительно немного наивно расчитывать остаться анонимным и тусить при этом в социальных сетях, пусть даже и закрытых :) Вычислить необходимого тебе кадра, используя их методику, вполне реально и самому.

LevM, 5 Апреля 2009 , url

Знакомая работа. Последнее время вообще участились работы по попылке де-анонимизировать информацию. Была еще статья о том как предсказать Social Security Number (типа, номер пасспорта) исходя из минимума личных данных.

fakenews, 6 Апреля 2009 , url

уже есть разработки которые позволяют по фрагментам текста определить автора. информацию об этом ранее можно было найти в гугле, сейчас уже нет — походу засекретили.

LevM, 6 Апреля 2009 , url

Не, не засекретили ;) Это общедоступные публикации. Проверьте stemming algorithms.

fakenews, 6 Апреля 2009 , url

не не =) алгоритмы понятны. один из университетов насколько я помню разработал готовую систему, которую можно было даже скачать, что то вроде студенческой курсовой или может чья-то научная работа.

LevM, 6 Апреля 2009 , url

Есть несколько бесплатных пакетов для natural language processing. Уж не упомню названий. Правда, они больше ориентированы на разбивку текста на токены и их классификацию ( по частям речи, соотношения между ними, роль в предложении и т.п.). Думаю, идентификация авторов была основана на этом.
Кстати, многие из этих разработак таки спонсируются американским правительством. Поэтому последнии годы они стали поддерживать арабаский и китайские языки.

fakenews, 6 Апреля 2009 , url

это n-gram анализ. понятно что он использовался, но этого мало для достоверности.

Max Folder, 5 Апреля 2009 , url

А какая сеть не является анонимной? Есть форумы и имиджборды, но там, вроде, нет связей между пользователями.
По-моему, настоящие американские учёные Арвинд Нарайянан и Виталий Шматиков совершили открытие в стиле "Если на небе тучи, то вероятность дождя резко повышается".

LevM, 5 Апреля 2009 , url

Идея то их не сложна и каждому понятно что она работает. Должна работать.Но они певые кто засучили рукава и таки применили ее на практике.
У этой тематики серьезные аспекты. Те кто работают с такого рода сетями попадают под юрисдикцию IRB — комиссий обязаных гарантировать права испытуемых. Так как информированое согласие со всех получить не реально, то данные анонимизируют и считается что пользователи обезопасены. Теперь, когда (далеко не вдруг, вы правы) оказалось что многих можно идентицировать, все возможно, сильно усложнится.

Mindwork, 5 Апреля 2009 , url

Лев хорошо все объяснил. Макс, я думаю речь идет о пользователях, которые зарегены в этих сетях, под каким-нибудь левым ником и без личных данных, уповая при этом остаться анонимным. Ученые показали, что по структуре их свзяей их несложно вычислить. Согласен с тобой и Львом, что идея-то очевидная.

comander, 6 Апреля 2009 , url

Поддержу Макса.
ученые взяли две открытых сети — пользователей которые осознанно участвуют в сетях не анонимно.
такие "законопослушные" пользователи не парятся на тему собственной идентификации и в естественном порядке воспроизводят свой круг общения.

сделали вид, что пользователи первой из них являются анонимными

если же предположить что пользовательхочет анонимности — то надо понимать что своих "друзей" по другим сетям он вряд ли будет "френдить".
я думаю если бы исследователи провели эксперимент на настоящих анонимах — они бы получили обратный результат — угадывание в 10% случаев.

comander, 6 Апреля 2009 , url

вот если бы они по контактам в аське начали вычислять — там бы все заработало имхо.
взаимопересечение IM должно быть раза в 3 выше чем у соцсетей. имхо.

LevM, 6 Апреля 2009 , url

Аська? Что это такое? На западе ей очень мало кто пользуется.
Если серьезней, то проблема IM в том что сеть невозможно стянуть из интернета crawlerом. Надо получить из компании. И тут анонимность вообще очень болезненая тема. Т.е. ни одна компания не раскроет вам имена реальных пользователей предоставляя вам логи их активности. И правильно сделает.

comander, 6 Апреля 2009 , url

и слава богу

precedent, 6 Апреля 2009 , url

Вы правы: это были не партизаны из СНГ, а игра в прятки застенчивых иностранцев.
Разбитых серверов и набитых морд не было? Не было. Сети не разорваны, экспериментаторы не отвлекались на вопросы собственного выживания, не… не наши.

LevM, 6 Апреля 2009 , url

ученые взяли две открытых сети — пользователей которые осознанно участвуют в сетях не анонимно.

Верно, но вся суть именно в том что они анонимизировали одну из сетей и пользуясь второй восстановили имена многих пользователей. После чего, проверили верно-ли восстановили. Революция? Нет. Но имеет колоссальное принципиальное значение. Как прецендент. Я писал сверху почему.
Кроме того, есть и практичное значение. Одна из серьезных проблем соц. сетей сегодня — их разрозненость. Каждый сидит в 10 сетях и имеет разные (хотя зачастую и пересекающиеся) сферы общения. Многие пытаются надстроить общую сеть, объединить все "кусочки" вместе. В этом смысл и OpenID и Facebook connect и еще десятка схожих технологий. Они предлагают способ этому посодействовать. Опять-же, не революция. Но и не из пальца высосано.

De-Luxis, 5 Апреля 2009 , url

Как все сложно. Просто берешь вирус, закидываешь, и все. Еще можно просто стать "другом" в соц. сети.

precedent, 5 Апреля 2009 , url

Неужели существовала такая проблема… Социальная сеть — сама в сетях интернета, а сети интернета опять же в сети.

LevM, 6 Апреля 2009 , url

Вот вы в сеть и попались. Хрен теперь из этой казуистики выберетесь ;)

precedent, 6 Апреля 2009 , url

казуистика- моя стихия

LevM, 6 Апреля 2009 , url

Зато сети — моя ;)

psyhedg, 6 Апреля 2009 , url

В доме, который построил Джек.

Netto, 6 Апреля 2009 , url

Может быть связка Flickr — Twitter и будет работать на 12% погрешости. Зато Макс прав на 100%, упомянув

имиджборды. Например какой-нибудь нульч если и связан с форчаном, то настолько КОСВЕННО, что как там по такой схеме анонимизировать кого, я без малейшего понятия.

Max Folder, 6 Апреля 2009 , url

Я, к сожалению, не осилю математический текст на английском, но так, как это описано по-русски, то исследование имеет смысл только в том, что доказывает тот факт, что при определенных условиях анонимные пользователи могут быть легко деанонимизированы.

John-Doe, 6 Апреля 2009 , url

определенныt условия это я так понимаю:

существуют связи, которые также доступны сторонним наблюдателям.

Max Folder, 6 Апреля 2009 , url

Ну да.

Max Folder, 6 Апреля 2009 , url

Кстати, я выявил Dreammaker'а на searchengines — у него такой же ник и аватар;-)

Войдите или станьте участником, чтобы комментировать

Ученые создали методику для вычисления анонимных пользователей с помощью социальных сетей

Вход без регистрации

Для участников

Или войдите через OpenID