Найдено революционное решение «Дилеммы заключенных»

отметили
20
человек
в архиве
Найдено революционное решение «Дилеммы заключенных»
Известная «Дилемма заключенных» служит в теории игр примером обоюдного вреда от некооперативного поведения двух игроков. (Некооперативное поведение — это поведение, при котором игроки не договариваются и не ищут компромисса друг с другом). Однако недавно известный физик Фримен Дайсон, а также его коллега Уильям Пресс, показали существование доминирующих стратегий, позволяющих игроку «Дилеммы заключенных» получить выигрыш и при некооперативном поведении.

Напомним условия «Дилеммы заключенных»: два подозреваемых совершили два разных преступления и у каждого есть улики на другого. Информатор получает 1 год тюрьмы, в то время как не сотрудничающий с полицией — 10 лет. Если информаторами становятся оба, то оба получают по 7 лет; если оба не сотрудничают с полицией, то каждый получает 3 года заключения.

До исследования Дайсона и Пресса оптимальной стратегией для каждого игрока в данном случае считалось информирование полиции, поскольку худший вариант при сотрудничестве (7 лет) все же лучше худшего варианта при отказе от сотрудничества (10 лет). Оптимальная стратегия парадоксальным образом является не самым лучшим вариантом, поскольку сотрудничество игроков (обоюдный отказ от информирования) позволило бы им получить всего всего по 3 года. Подобная неоптимальность выбора характерна для многих игр с некооперативным поведением.

«Дилемма заключенных» хорошо описывает многие социальные и экономические процессы, в частности гонку вооружений, приводящую к чрезмерной вооруженности, дуополию на рынке, ведущую к сверхвысоким ценам, нежелание каждой страны ограничивать свои вредные выбросы и т.д.

Дайсон и Пресс в своей статье «Iterated Prisoner’s Dilemma contains strategies that dominate any evolutionary opponent», написанной на довольно сложном математическом языке, показали совершенно новое решение «Дилеммы заключенных». Существование доминирующих стратегий, позволяющих получать перевес одному игроку и при некооперативном поведении, полностью меняет представление о процессах и поведениях, описываемых данной моделью. Удивительно и то, что открыто новое решение одного из самых изученных примеров в теории игр.
Добавил Ronya9 Ronya9 15 Августа 2012 (исправил Shura.Fe Shura.Fe)
проблема (1)
Комментарии участников:
AnatolyV
+1
AnatolyV, 15 Августа 2012 , url
Аууу…
Так не честно.
Первоисточник не открывается, а в тексте новости не описано, как решать дилемму. :-)

upd:
открывающаяся ссылка

статья на аглицком
AnatolyV
0
AnatolyV, 15 Августа 2012 , url
Есть кто-нибудь, кто смог понять суть?

Основной вопрос к прочитавшим — аксиома выбора в доказательстве используется?
А аксиома детерминированности?
PhD
0
PhD, 15 Августа 2012 , url
По-моему, это статья ради статьи. Таких Дайсонов в мире миллионы, они пишут псевдонаучные статьи где попало, но на интересные темы. Потом каждый журналист, который не прочь зачесть себе статью на такую тему, приукрашивает ее и так доходит до «гениальности» «открытия», суть которого «написанной на довольно сложном математическом языке»-)
AnatolyV
+4
AnatolyV, 15 Августа 2012 , url
Ну кагбе Фримен Джонсов Дайсонов (Freeman J. Dyson) таки не так уж и много
Ronya9
0
Ronya9, 15 Августа 2012 , url
Текст статьи на английском языке доступен по ссылке www.pnas.org/content/early/2012/05/16/1206569109.full.pdf+html.
PhD
-2
PhD, 15 Августа 2012 , url
Так в чем же оно заключается?
написанной на довольно сложном математическом языке
показали совершенно новое решение… Существование доминирующих стратегий, позволяющих получать перевес одному игроку и при некооперативном поведении
Фамилия автора статьи «кагбэ намекаэ» — Дайсон, «работающий над играми». От слова "Dice"-)
Ronya9
+1
Ronya9, 15 Августа 2012 , url
Фримен Дайсон — известный физик, предложивший «сферу Дайсона», поглощающую максимум излучения звезды
PhD
0
PhD, 15 Августа 2012 , url
Не всем вредны азартные игры=)
AnatolyV
0
AnatolyV, 15 Августа 2012 , url
Стратегия ZD определяется в терминах четырех вероятностей: вероятность того, что игрок будет сотрудничать, учитывая четыре возможности для действий обоих игроков в предыдущем раунде. Левая: конкретный пример, называемого вымогательства-2, заставляет отношения S X — P = 2 ( S Y — P ) между показателями двух игроков. Вымогать-2 гарантирует игроку X в два раза доли выплат выше P, по сравнению с данными, полученными от своего противника У. соответствующей стратегии ZD, что мы называем ZDGTFT-2 силами отношения S X — R = 2 ( S Y — R ) между игроков баллов. ZDGTFT-2 является более щедрым, чем вымогать-2, предлагающие более высокий Y часть выплат выше P. Право: Мы моделировали ( 13 ), эти две стратегии в турнире аналогична Аксельрод ( 6, 7 ). ZDGTFT-2 получила самую большую сумму выигрыша, даже выше, чем синица за око и щедрым-Тит-за око, традиционные победители. Вымогать-2 получила более низкий общий выигрыш (потому что его оппоненты не развивается), но он выиграл больше голова к голове матчей, чем любой другой стратегии, кроме Всегда дефектов.

Круто!

Ни один игрок не может улучшить свою оценку с нарушением этого договора, и каждая из них несет наказание за любые чисто злостное нарушение.
PhD
-1
PhD, 15 Августа 2012 , url
«Дилемма заключенных» красивое словцо, применительно к этой статье. А данные стратегии и рассматриваются в отрыве от других.
Ronya9
0
Ronya9, 15 Августа 2012 , url
Статья действительно трудна для перевода на обычный язык и сложна в понимании для человека без серьезной математической подготовки.

Полный текст статьи на английском языке доступен по ссылке www.pnas.org/content/early/2012/05/16/1206569109.full.pdf+html.
John-Doe
0
John-Doe, 15 Августа 2012 , url
Уж не знаю, насколько там сложна статья для понимания, но раз сказано что есть выгодное решение позволяющее получать перевес одному игроку и при некооперативном поведении…
то могли бы и пример привести без всяких теоретических выкладок — а практическую релизацию для «Дилеммы заключенных»
AnatolyV
0
AnatolyV, 15 Августа 2012 , url
Во-первых, хотя и не уверен, что это относится к данному конкретному случаю, следует учитывать, что существование чего либо может доказываться без приведения конкретного примера (так наз. чистая теорема существования).

Во-вторых, в данном случае игра идет не на получения относительного преимущества друг относительно друга (то есть перевеса), а на получение абсолютной выгоды каждым игроком независимо (т.е. задача не является игрой с нулевой суммой).

Насколько я понял приводится какой то хитрый вид стратегии с наличием договора и потенциальной возможностью его нарушить, а потом доказывается, что

Ни один игрок не может улучшить свою оценку с нарушением этого договора, и каждая из них несет наказание за любое чисто злостное нарушение.

Это очень крутой результат. Было бы здорово в жизни все положить на подобные стратегии.
Ronya9
0
Ronya9, 15 Августа 2012 , url
насколько я поняла, договора как раз между игроками и не было — игра остается некооперативной. При определенных условиях (описанных сложно для меня математически), если один игрок будет вести определенную выгодную стратегию, а второму эта стратегия неизвестна даже теоретически, то первый игрок получает преимущество над другим.
AnatolyV
0
AnatolyV, 15 Августа 2012 , url
ИМХО.
Игра некооперативная в том смысле, что каждый игрок старается максимизировать свою личную выгоду и имеет полное право нарушить любой договор. Но сам договор, как таковой, присутствует и некий канал общения между игроками таки подразумевается.
Ronya9
0
Ronya9, 15 Августа 2012 , url
согласна
Ronya9
0
Ronya9, 15 Августа 2012 , url
Я всю новость привела как раз, чтобы специалисты изучили теоретические выкладки и разработали практические реализации. Имеющий уши да слышит… А у меня самой нет достаточных знаний в математике, чтобы самостоятельно разработать реализацию


Войдите или станьте участником, чтобы комментировать