Добрый день.
Уже три недели прошло с выхода заметки «От Колмогорова к Максвеллу, Лапласу, Байесу», уже более сотни интереснейших комментариев написано, множество копий сломано, несколько заблуждений сформулировано и разобрано. Иногда, к сожалению, собеседники переходили на личности, называли высказывания друг друга чушью, не убедившись, что правильно поняли друг друга. Но не зря борьбу за правду называют борьбой.
Комментарии к той записи сами по себе очень интересны (и продолжение темы, начатой в заметке, конечно, скоро будет опубликовано), но сегодня я предлагаю начать обсуждать интересную задачу из тех комментариев, в которой неожиданным образом показывает себя понятие «средний выигрыш». Ну а для тех, кто не очень любит теорию вероятностей, есть специально заготовленная коллекция «пирожков» (спасибо всем, кто вспомнил свои любимые «пирожки» в комментариях!).
Итак, задача:
Представьте, что вы изобрели такую стратегию игры на фондовой бирже, что она позволяет с вероятностью 90% удваивать торговый капитал, а с вероятностью 10% полностью его терять. Ясно, что с такой стратегией нельзя подставлять под риск весь свой капитал — какой-то процент надо держать в запасе, чтобы всегда можно было возобновить игру, когда «черный лебедь» слизнет весь торговый капитал. Вопрос: какую долю капитала было бы оптимально использовать для игры, а какую всегда сохранять?
Тонкость этой задачи в том, что надо сначала определить, что такое «оптимально» (вспомните задачу Бертрана, в которой понятное и простое условие можно было понимать самыми разными способами). Многие считают, что в этой задаче достаточно посчитать математическое ожидание выигрыша, чтобы определить, на какую сумму играть.
Давайте проделаем это. Пусть x (число от 0 до 1) — доля капитала, которую мы всегда сохраняем. Каким будет средний выигрыш M1(x) за одну игру?
M1(x) = 0.9 * (x + 2 * (1 - x)) + 0.1 * x
(т.е. с вероятностью 90% мы удвоим капитал (1-x), сохранив сумму x, а с вероятностью 10% у нас останется только x).
Давайте найдём x, чтобы функция M1(x) приняла максимальное значение. M1(x) = 1.8 - 0.8 * x. Получается, что чем меньше x, тем выше средний выигрыш. Пожалуй, тут не поспоришь, при одной игре с такими выгодными условиями неразумно оставлять себе хоть что-то, а стоит играть на все.
А что будет при серии из двух игр? Давайте вычислим M2(x).
M2(x) = 0.9^2 * (x + 2 * (1 - x))^2 + 0.1^2 * x^2 + (1 - 0.9^2 - 0.1^2) * (x + 2 * (1-x)) * x
(т.е. с вероятностью 81% [0.9 в квадрате] нам повезёт удвоить капитал дважды, сохраняя на каждом этапе долю x от него, с вероятностью 1% мы дважды проиграем [и сохраним тогда всего x^2 денег], а в остальных случаях мы один раз удвоим капитал (1-x), сохранив x, а один раз «умножим его на x», причём, неважно, в каком порядке).
Найдём x, при котором M2(x) имеет максимальное значение:
M2(x) = 0.64 * x^2 - 2.88 * x + 3.24.
Легко видеть, что эта функция задаёт параболу, ветви которой идут вверх, а наименьшее значение принимается при x > 1. Другими словами, максимальное значение на интервале [0, 1] функция M2(x) принимает в при x=0. Получается, и в серии из двух игр выгоднее не оставлять часть капитала, а «играть на все».
И так далее.
Теперь возникает вопрос: если бытовая интуиция говорит нам «сохрани хоть сколько-то, чтобы иметь возможность возобновить выгодную игру, если вдруг не повезёт», а сухая математическая наука говорит «выгоднее всего играть на всю сумму», то кому верить?
Ну и попутно ещё масса вопросов:
- Верно ли, что математическое ожидание выигрыша будет максимальным при нулевом x для любого количества игр?
- Что такое «оптимальная стратегия» при такой игре? (не «какой она является», а «как понять, что найденная стратегия является оптимальной»)
- Какую сумму x вы бы откладывали от имеющихся денег, если бы планировали сыграть большое количество игр (например, миллион игр)? А если бы всего 3 игры? А если 10 игр?
Хорошей недели!
Ну так а при чём тут суровая математическая "наука"? "Наука" предлагает максимизировать выигрыш. Здравый смысл предлагает минимизировать проигрыш, и это разные задачи, вот они и не сходятся.
ОтветитьУдалитьНу как же? Если всегда играть на все, то в плюсе удастся оставаться только с вероятностью 0.9^N, а во всех остальных случаях игрок останется совсем без денег. А при росте N эта величина стабильно стремится к нулю.
УдалитьДругими словами, начиная с какого-то количества игр может оказаться, что игрок будет почти всегда оставаться ни с чем. Например, при N=100 игрок будет многократно удваивать свой капитал с вероятностью ~3*10^-5 (т.е. почти никогда), а в остальных 99.9973% случаев игрок останется без капитала.
Разве это можно назвать "максимизацией выигрыша"? Скорее это будет "максимизацией какой-то невнятной функции". Так? Или не так?
Вероятность мала, зато прибыль 1,27*10^32 - отсюда и ожидание высокое.
УдалитьЯ понимаю, откуда ожидание высокое.
УдалитьВопрос в том, требуется ли нам высокое математическое ожидание, когда мы ищем оптимальную стратегию. Вопрос в том, что называть оптимальной игрой для этой задачи.
Другими словами, начиная с какого-то количества игр может оказаться, что игрок будет почти всегда оставаться ни с чем. Например, при N=100 игрок будет многократно удваивать свой капитал с вероятностью ~3*10^-5 (т.е. почти никогда), а в остальных 99.9973% случаев игрок останется без капитала.
УдалитьСовершенно верно, поэтому заниматься оптимизацией M (в текущей версии) бессмысленно, поскольку M не отражает цитируемый факт. Правильно заданный "лагранжиан" (как сказал бы физик) M должен стремиться к нулю при x=0 и N стремящемся к бесконечности.
Злой анонимный Х.
Сухость математики не при чем, надо правильно ею пользоваться.
> Совершенно верно, поэтому заниматься оптимизацией M (в текущей версии) бессмысленно, поскольку M не отражает цитируемый факт
УдалитьЯ никак не могу понять, что эта фраза означает. Поясните, пожалуйста (больше всего хотелось бы понять, что означает "М" в этом утверждении).
Даю более развернуто. Это искусство вариационного исчисления. Найти правильный вид для каждого n функции Mn(x), которая имеет экстремум на отрезке для x [0, 1]. Здесь к слову ещё есть зависимость от вероятности, но по задаче принимаем её константой 0.9.
УдалитьВы Илья в статье предложили конкретный вид M1 и M2. Проверим, удовлетворяют ли они прикладному смыслу задачи.
Давайте посмотрим какие краевые ограничения на вид Mn.
Если x стремится к 1 (мы почти не играем в игру), то M должно стремиться к 1 (остаемся всегда почти при своих независимо от вероятности). Это условие стало выполняться для M1 и M2 после моих поправок.
Ещё условие. Если x=0 (ираем вабанк), то при устремлении n к бесконечности M стремится к нулю. Это условие очевидно не выполняется для предложенного вида Mn (ведь Вы же написали "и так далее", значит понятно какой общий вид для Mn Вы имели ввиду).
Злой анонимный Х.
PS
УдалитьТ.е даже не дойдя до обсуждения и понимания, что такое оптимальность, видно что вид Mn не из жизни.
Злой анонимный Х.
Спасибо за подробный ответ!
УдалитьДа, я предложил попробовать проверить естественную для многих студентов идею - максимизировать математическое ожидание прироста капитала. И показал, что результат получается странный. Если я правильно понимаю, теперь Вы решили ещё раз обратить внимание на то, что такое Mn тут выбирать неправильно. Полностью с Вами согласен. Осталось понять, как правильно решать эту задачу.
А до этого надо определиться, что такое оптимальное решение этой задачи (т.е., как про какое-то решение понять, является ли оно оптимальным).
Илья, объясните пожалуйста, что Вы формулами M1 и M2 считаете. Или поправьтесь, вероятно Вы допустили ошибку.
ОтветитьУдалитьПо поводу M1.
Пусть a - начальный капитал. У Вас относительный выигрыш в случае успеха равен 2 * (1 - x), а на самом деле он равен (2 - x). Т.е. конечный капитал равен (2-x)*a по сравнению с начальным a. Проверяем: если поставить ровно половину и ставка сыграет, то денег станет a+0.5*a=1.5*a, т.е. 1.5 = (2-x) при x=0.5.
Аналогичная претензия и к формуле M2.
Злой анонимный Х.
Спасибо, что указали на эту серьёзную ошибку!
УдалитьPS
ОтветитьУдалитьЕще как проверяется: при x стремящемся к 1, матождиние относительного выигрыша стремится (должно) к 1, если Вы именно матождиние относительного выигрыша считаете.
Злой анонимный Х.
Да, это хороший способ тестировать правильность выкладок!
УдалитьПриведу свои рассуждения.
ОтветитьУдалитьМожно ввести коэффициент прироста при выигрыше K = x+(1-x)*2, где х - сохраняемая часть. Этот коэффициент очевидно принадлежит интервалу [1,2], для х от 1 до 0 соответственно. Для двух выигрышей подряд итоговый прирост будет составлять K^2,для трех K^3 итд. Для данной вероятности в 90% итоговая формула прироста для неопределенно большого количества игр будет (x+(1-x)*2)^9 * x . Конечно это достаточно грубое приближение, но я счел его приемлемым. Максимум этого выражения достигается при x порядка 0.2 и соответствует "коэффициенту размножения" около 40. Таким вот неожиданным (или тщательно спланированным) образом мы сталкиваемся с правилом 80/20 .
80/20 здесь получилось просто из-за того, что исходная вероятность была 90/10 :)
УдалитьДля данной вероятности в 90% итоговая формула прироста для неопределенно большого количества игр будет (x+(1-x)*2)^9 * x
УдалитьГрубое заблуждение. Итоговый прирост (x+(1-x)*2)^9 * x будет только в очень редком количестве случаев. Во первых N=10 (количество игр строго равно десяти). Во вторых относительное количество для таких случаев по отношению к количеству всевозможных случаев для N=10: "Цэ из 9 по 10 деленное на 2 в степени 10". Редко какая домохозяйка, сыгравшая 10 игр, удостоится выигрыша (x+(1-x)*2)^9 * x
Эта группа домохозяек самая многочисленная из всех, сыгравших 10 игр - это факт. Но количество домохозяек в данной группе по отношению к общему количеству домохозяек, сыгравших в 10 игр, очень и очень мало.
А экстраполировать результат на неопределенно большого количества игр настолько механически довольно странно, да еще и ошибочный.
Злой анонимный Х.
Хех, злой вы, анонимный Х.
УдалитьНасчет прироста я конечно не совсем корректно выразился, его следует понимать сугубо как коэффициент. А коэффициенты можно перемножать в достаточно произвольном порядке. И я не утверждаю что соотношение выигрышей и проигрышей будет постоянным для любой последовательности из 10 игр, формула соответствует эдакому "среднему из нескольких серий", мы имеем на это право хотя-бы потому, что нам обещали вероятность выигрыша 90%. Но это совершенно не означает что за 10 игр мы надежно увеличим исходную сумму, имевшуюся перед игрой, в 40 раз. Один лишний проигрыш, и коэффициент для такой серии будет чуть больше единицы. Однако все меняется для достаточно больших серий, там в среднем 1 проигрыш и 9 выигрышей в пересчете на 10 попыток будут уже просто по статистике. А имея 100 рублей и 1000 попыток можно надежно выиграть всю видимую часть вселенной, и еще на звезду смерти останется.
Вот здесь я готов поддержать "незлого анонимного" против "злого анонимного Х"! :)
УдалитьВот эта фраза "злого":"Итоговый прирост (x+(1-x)*2)^9 * x будет только в очень редком количестве случаев" - неверная.
На самом деле вероятность таких случаев - более 0,3 для десяти туров игры.
А точнее: (0,9)^10=0.3486...
И, кстати, выражение "Итоговый прирост (x+(1-x)*2)^9 * x"
даёт максимум именно при х=0.2.
Это подтверждает и "Николай Сергушенков" в своем сообщении от "Apr 11, 2012 01:49 AM" несколькими постами ниже:
"пять минут экспериментов в Экселе подсказывают, что максимальная прибыль будет для х=0.2"
Так что предложенная "незлым анонимом" модель хорошо описывает ситуацию, заданную условием задачи.
Объясните что означает Ваше "в среднем", иначе ничего не понятно.
УдалитьПодумайте в чем разница между относительной разницей и абсолютной разницей. Каламбур получился.
Вот тезисы для раздумий. Пусть k количество выигрышей в серии из n попыток. Очевидно что k/n стремится к 0.9 по условию задачи при n стремящемся к бесконечности по закону больших чисел.
Но вот еще один факт. Оказывается (k+1000)/(n+1000) тоже стремится к 0.9 по тому же самому закону. Нет никаких гарантий, что у нас не будет 1000 "лишних" сыгравших ставок (впрочем и про несыгравших так же можно сказать).
Думаем дальше и приходим к выводу, что вероятность выиграть лишних 1000 раз гораздо выше чем вероятность проиграть лишних 1000 раз.
Как сказал (c) Wanderer, "я на таких картах не пасую".
Злой анонимный Х.
Еще одна претензия к M2.
ОтветитьУдалитьВероятность того что будет сыграна одна ставка и не сыграна вторая ставка равна (1 - 0.9^2 - 0.1^2)= 2* 0.9*0.1,
а не (0.9^2 - 0.1^2).
Злой анонимный Х.
Спасибо большое, что обратили внимание на опечатку! Уже исправлено.
УдалитьНавскидку, особо не думая - если количество игр меньше пяти, то выгодно играть на всё. Для серии из 5..6 игр вероятность проиграть всё сравняется с вероятностью выиграть и тут нужно вводить резерв.
ОтветитьУдалитьДля серии свыше 10 игр вероятность проигрыша как минимум в одной партии равна 1, т.е. игра без резерва ведёт к потере всего.
Оптимальная стратегия должна учитывать психологическую готовность к риску потерять ставку. Если вы играете на месячную зарплату - одна стратегия, если играете на свою квартиру (а на новую вам собирать лет 100) - стратегия будет другая.
Если исходить из того, что ставку потерять не жалко, то оптимальной стратегией будет максимизация прибыли в долгосрочной перспективе. Слышал, что
> Для серии свыше 10 игр вероятность проигрыша как минимум в одной партии равна 1
УдалитьВажно понимать, что это неверно. Эксперименты по условию не зависят друг от друга, поэтому вполне возможна ситуация, когда игрок не проигрывает на протяжении не только десяти, но и сотни, и тысячи игр.
Неверно - с формальной точки зрения. Я не говорю, что из 10 игр обязательно будет в одной проигрыш. Бывает, что и монета 10 раз подряд падает орлом, но я бы рассчитывал на то, что примерно пять раз выпадет решка.
УдалитьЯ очень быстро забываю термины, поэтому возможно надо было написать не вероятность, а матожидание или риск, или еще что-то :) , но смысл остаётся тем же
Буду ждать правильный ответ :)
> Я не говорю, что из 10 игр обязательно будет в одной проигрыш
УдалитьОтлично! Это то, что я хотел бы явно зафиксировать (увы, нередко приходится сталкиваться с подобным заблуждением).
> Буду ждать правильный ответ :)
Нам бы сперва правильный вопрос понять :)
Слышал, что у биржевиков есть спецнаука - управление капиталом - как раз на эту тему. Не изучал, но пять минут экспериментов в Экселе подсказывают, что максимальная прибыль будет для х=0.2 :) Это для любого количества игр больше 10. Для 3 - смотри первый абзац.
ОтветитьУдалитьЯ как гэмблер и покерист, здравым смыслом :) понимаю, что дело здесь в количестве испытаний. При одном-двух-трех с такими шансами выгодно играть "all-in" для максимизации value.
ОтветитьУдалитьНо при большом количестве испытаний вероятность не-наступления события В, то есть потери всего, стремится к нулю. Очевидно, что при неограниченно большом количестве попыток мы в конечном итоге останемся с той суммой, которую отложили. То есть играть в игру "double or nothing" в длительной перспективе вообще не имеет смысла.
Очевидно, для данного конкретного соотношения вероятностей нужно вычислять не только x, но и предельное для него N. Вообще это получается уравнение с двумя неизвестными, не факт что имеющее решение.
Больше пока на бегу второпях и из здравого смысла не успеваю, а посчитать пока некогда. Вечером посмотрим :)
Мне кажется, дело в том, что в реальной жизни мы пытаемся максимизировать полезность выигрыша, а не полученную сумму. А функция полезности денег при достаточно больших суммах замедляет свой рост, поэтому интуиция предпочитает "синицу в руках", увеличивая x.
ОтветитьУдалитьПо той же причине я бы предпочёл получить $1000000 с вероятностью p, чем $1000000000 с вероятностью p / 500, хотя матожидание выигрыша во втором случае и больше вдвое.
Рассматриваю чисто математические аспекты этой задачи. А иначе я согласен с Daniil Burdakov.
ОтветитьУдалитьЧтобы говорить об оптимальности, нужна цель. Интуитивно мы за таковую принимаем либо
"максимально увеличивать капитал за фиксированное количество ходов"
т.е. пытаемся максимизировать мат. ожидание выигрыша за ход. Тут надо идти ва-банк, по причинам, расписанным в посте.
либо
"увеличивать капитал в N раз за минимальное количество ходов".
Здесь и нужно сохранять часть суммы, ибо с вероятностью 0.1 мы её теряем и обрекаем себя на бесконечное количество ходов, а 0.1 * бесконечность - это всё равно очень очень много :).
Мне кажется "оптимальная" стратегия в условиях реальной жизни будет разной для каждого человека.
ОтветитьУдалитьПриведу такой экстремальный пример.
Допустим человеку нужны через год деньги на операцию, от которой зависит его жизнь, или жизнь его ребенка. И для этой операции ему нужно в сто раз увеличить свой капитал.
В таком случае он выберет ту стратегию, которая с максимальной вероятностью даст ему выигрыш в сто раз или более. И эта стратегия кстати зависит также от количества игр, которые он успеет сыграть за этот год.
Пример конечно экстремальный, но я хотел показать, что такую игру мы не можем рассматривать только по "сухой математике". В любом случае есть время игры, и приоритеты играющего. Кто-то играет на снижение дисперсии, кто-то хочет сорвать куш.
Для любого количества игр, я бы строил график распределения вероятностей финального капитала для разных х и выбирал бы уже, что меня устраивает =)
Ну а максимальное ожидание в любом случае будет, если ставить каждый раз все.
А мне вот, почему-то, кажется странным сама постановка вопроса.
ОтветитьУдалитьВ условии задачи уже предполагается набор не оптимальных стратегий, и
предлагается выбрать из них самую оптимальную.
Ведь давно известно, что стратегия уменьшения ставки после проигрыша не является оптимальной, а наоборот, после проигрыша ставку следует увеличивать (см. "мартингал").
> В условии задачи уже предполагается набор не оптимальных стратегий, и
Удалитьпредлагается выбрать из них самую оптимальную.
А так всегда в жизни - приходится выбирать лучшее из возможного.
> стратегия уменьшения ставки после проигрыша не является оптимальной
Этой возможности у игрока нет. Он один раз выбирает, какую долю x своего капитала будет сохранять, а на какую играть. И далее все N итераций пользуется этим правилом, надеясь, что оптимально выбрал этот x.
>>Он один раз выбирает, какую долю x своего капитала будет сохранять, а на какую играть. И далее все N итераций пользуется этим правилом, надеясь, что оптимально выбрал этот x.>>
УдалитьДа, я именно это и имел в виду... Приведен пример в принципе неудачной стратегии:"Уменьшать ставку после проигрыша, увеличивать ставку после выигрыша". Налицо положительная обратная связь между результатом и корректирующим воздействием.
Пример удачной стратегии:"Увеличивать ставку после проигрыша, уменьшать после выигрыша".
Налицо отрицательная обратная связь между результатом и корректирующим воздействием.
Ясно, Вы говорите не про долю от капитала, а про абсолютное значение ставки. Тогда, действительно, имеет место положительная обратная связь.
УдалитьЗдесь нужно выходить из чисто вероятностной плоскости и вводить понятие, аналогичное risk aversion или loss aversion, которое индивидуально и зависит от абсолютного значения "капитала". Обычно для этого используют функцию полезности (utility function), которая в простейшей формулировке говорит насколько мы рады данному приросту капиталла. Чаще всего ее выбирают вогнутой (логарифмически или по степенному закону - например, квадратный корень), т.к. прибыль в 100 рублей к 100 рублям и прибыль в 100 рублей к 100000 воспринимаются совершенно по-разному.
ОтветитьУдалитьПусть, например, моя функция полезности U(y)=sqrt(y) (как я это измеряется - отдельный вопрос)
Тогда поставив 1-x и выиграв я получу U1=U(x + 2*(1 - x))=sqrt(2-x)
Поставив 1-x и проиграв я получу U2=U(x)=sqrt(x)
Математическое ожидание моей utility (не выигрыша) будет E[U] = 0.9*sqrt(2-x) + 0.1*sqrt(x)
Эта функция уже имеет максимум на [0,1]: при x=1/41. Т.е. конкретно для меня при данной игре "оптимальным" будет откладывать 1/41 капитала.
Хотя, конечно, функция полезности может разрешить не любой такой вопрос. Например, в Санкт-Петербургском парадоксе (немного напоминающем постановку этой задачи) можно показать, что какую-бы мы ни брали функцию полезности, всегда найдутся правила игры, при которой средняя полезность (как и средний выигрыш) будет бесконечной.
>> Итоговый прирост (x+(1-x)*2)^9 * x будет только в очень редком количестве случаев. Во первых N=10 (количество игр строго равно десяти). Во вторых относительное количество для таких случаев по отношению к количеству всевозможных случаев для N=10: "Цэ из 9 по 10 деленное на 2 в степени 10". Редко какая домохозяйка, сыгравшая 10 игр, удостоится выигрыша (x+(1-x)*2)^9 * x>>
ОтветитьУдалитьПриведенный выше пассаж верен единственно в случае вероятности выигрыша Р=1/2.
Для Р=0,9 "редко какая домохозяйка" - чуть больше, чем каждая третья. :)
Вы что хотите сказать, что одна третья это больше чем две третьх?
УдалитьКроме того не стоит так категорично заявлять без доказательств насчет ЕДИНСТВЕННО
Злой анонимный Х.
>>Вы что хотите сказать, что одна третья это больше чем две третьх?
Удалить----------------------------
Нет.
Я хочу сказать, что одна третья больше, чем "Цэ из 9 по 10 деленное на 2 в степени 10".
Правильно будет "Цэ из 10 по 9 умноженное на Р^9 и умноженное на (1 - P)".
Схема Бернулли, однако! :)
Вы совершенно правы, но я то тоже прав, просто со свойственной мне лаконичностью я упустил выкладки между вторым и третьим предложением, которые Вы любезно предоставили. Во втором предложении я говорил только лишь об относительном количестве возможных случаев подпадающих под условие на фоне всевозможных комбинаций. Я здесь не считал вероятность.
УдалитьЗлой анонимный Х.
Пусть C[i] - наш капитал после i-го раунда.
ОтветитьУдалитьC[i+1]/C[i] = либо x в случае проигрыша, либо (2-x) в случае выигрыша. Соответственно,
C[N]/C[0] = (2-x)^K * x^(N-K), где K - количество выигрышей из N раундов.
Величина K/N распределена как-то колоколообразно вокруг p. Поэтому представляется разумным максимизировать величину
(2-x)^p * x^(1-p).
Условие экстремума x = 2*(1-p).
При p=0.9 получается x=0.2, т.е. 20%.
Мне удобнее было принять за x ту часть котрой мы рискуем на каждом ходу.
ОтветитьУдалитьLet Zi = { 1+x, p=.9; 1-x, p=.1}, let S0 = 1, Sn = ∏Zi, i in [1..n].
Наша задача - максимизировать Sn. Дла простоты перейдем к логарифму.
T0=1, Tn=∑log(Zi). M(Tn)=∑M(log(Zi)) = n*(.9*log(1+x) + .1*log(1-x)).
Tn достигает максимума при (.9*log(1+x) + .1*log(1-x))' = 0. => .9/(1+x) - .1/(1-x) = 0 => x=.8.
QED
Моё решение для случая, если задача ставится как "увеличивать капитал в N раз за минимальное количество ходов".
ОтветитьУдалитьПоскольку в комментариях весьма скудные возможности по оформлению формул, то решение я оформил в виде картинки:
Основное решение.
Подробное приведение формул.
В результате оптимальное не вкладывать в игру 20% от общей суммы.
Спасибо за подробные выкладки!
УдалитьЯ думаю, многим будет очень интересно изучить.
Допустим мы сыграли N раз. Из них мы выиграем 9N/10 раз и проиграем N/10 раз (при N стремящемся к бесконечности).
ОтветитьУдалитьПри этом наш выигрыш составит:
(2-x)^9K * x^K, где x - это часть денег, которую оставляем, а K = N/10.
Максимум этой функции достигается при x = 2/(9+1) = 0.2
Можно проверить, что при вероятности выигрыша меньше или равной вероятности проигрыша, максимум будет достигаться при x = 1, т.е. играть в таких условиях становится не выгодно. А для любого другого соотношения можно подобрать оптимальный резерв по формуле:
x = 2/(p+1), где p - отношение вероятности выигрыша к вероятности проигрыша.
Я хотел бы обратить лишний раз внимание читателя на следующие слова Ильи:
ОтветитьУдалитьТонкость этой задачи в том, что надо сначала определить, что такое "оптимально" (вспомните задачу Бертрана, в которой понятное и простое условие можно было понимать самыми разными способами).
Иначе говоря, перед нами поставлена состоящая из двух частей проблема: (1) дать чисто формальное, т.е. математическое, или хотя бы более или менее четкое определение интуитивному понятию "оптимальная стратегия для этой игры" и (2) найти конкретную стратегию, которая является оптимальной в полном соответствии с данным в первой части определением.
Ясно, что не разобравшись с первой частью проблемы, невозможно даже приступить к решению второй ее части. Скажу больше: первая часть является по-настоящему творческой проблемой и она гораздо важнее второй, рутинной части, решение которой вполне можно доверить даже далеким от жизни математикам.
Похоже все комментаторы без исключения согласны, что максимум мат ожидания выигрыша никак не может служить в качестве критерия оптимальности стратегии в этой игре: он сильно противоречит здравому смыслу и интуиции. С другой стороны, я вижу только два четко сформулированных подхода к решению первой части проблемы. Вот они:
(1) Оптимальную стратегию разумно определить как стремление максимизировать мат ожидание не выигрыша, а утилиты выигрыша, т.е. полезности выигрыша для данного игрока (Daniil Burdakov, Vladimir). Эта идея конечно не нова; она впервые была предложена тезкой Burdakovа Даниилом Бернулли почти 300 лет тому назад в знаменитой статье, где он предложил решение Санкт-Петербургского парадокса, с которым, между прочим, не согласился автор парадокса Николас Бернулли. Николас охотно соглашался, что идея мат ожидания утилиты (moral expectation) действительно гениальная идея, но считал, что предложенное его племянником решение не затрагивает истинную суть парадокса, и поэтому не может считаться успешным разрешением Санкт-Петербургской проблемы. Санкт-Петербургский парадокс, как правильно заметил Vladimir, немного напоминает постановку нашей задачи. Не буду отвлекаться, но скажу, что подобие между этими двумя проблемами гораздо глубже, чем простое сходство в постановке. Этот подход к решению первой части нашей проблемы (впрочем как сама идея утилиты вообще) имеет очень большой изъян - многое зависит от того, какую именно функцию мы выберем в качестве утилиты. Кроме того, нет удовлетворительного критерия для выбора этой функции, т.е. этот подход является типичным ad hoc. Сам Бернулли предложил логарифм в качестве утилиты, но чем логарифм лучше, скажем, квадратного корня ни он, ни кто-либо еще, не сумел убедительно обосновать.
(2) Оптимальную стратегию разумно определить как стремление минимизировать количество ходов, требующееся для увеличения капитала в определенное количество раз (Air). Эта идея, которую, пожалуй, яснее было бы назвать максимизацией темпов среднего роста капитала, тоже не нова и, если я не ошибаюсь, она по существу и есть оригинальная идея самого Келли. Недостаток этой идеи заключается в том, что ее можно логически обосновать только для большого количества раундов N, и не видно естественного способа ее обобщения для произвольного N.
У меня есть одна довольно интересная идея решения первой части обсуждаемой проблемы. Она не только лишена недостатков описанных выше двух освещенных временем подходов, но, если не ошибаюсь, является неизвестной до сих пор оригинальной идеей. В последующих комментариях я намерен предложить эту идею на суд читателя. Я очень надеюсь, что своей простотой, убедительностью логики и изъящностью формы она доставит удовольствие многим и завоюет сердце читателя.
Я определил для себя оптимальную стратегию как "максимум выигрыша при N игр", где N cтремится к бесконечности. Из этих N раз, при заданной вероятности выигрыша и проигрыша можно посчитать сколько раз мы выиграем и сколько проиграем. Ну а решение этой задачи я привел выше.
УдалитьМне кажется, что под формулировкой оптимальной стратегии может пониматься возможность систематически увеличивать свой капитал с максимально возможной скоростью роста. Это не то же самое, что максимизация выйгрыша.
ОтветитьУдалитьРассмотрим два крайних примера. Играем на все. При стремлении количества опытов к бесконечности вероятность потерять все стремится к 1. По-русски говоря, это значит, что чем дольше играешь, тем больше вероятность когда-нибудь все проиграть. Другой крайний пример - все резервируем: ну тут понятно, опять ничего не выйграем. Оптимум где-то посередине.
Аналитикой лень под утро заниматься. Быстренько прикинул в экселе - оптимум где-то в районе 0,3 находится.
Кроме того возможны стратегии, когда в оборот идет не переменная часть имеющейся в наличии суммы. Задачка очень многогранна ) На целое мини-исследование тянет )
Пусть
ОтветитьУдалитьР - вероятность удвоить ставку за один кон.
(1-Р) - вероятность потерять ставку за один кон.
Требуется определить оптимальное значение величины
Х - части наличного капитала, которую необходимо оставлять в резерве.
Соответственно,
(1-Х) -это та часть имеющихся в нашем распоряжении средств, которую мы ставим на кон.
В результате одного розыгрыша наш капитал может либо увеличиться до величины
Х + 2*(1 - Х) = 2 - Х, с вероятностью Р,
либо уменьшиться до величины Х с вероятностью (1 - Р).
Искомая оптимальная величина Х может быть определена из пропорции:
(2 - Х) / Х = Р / (1 - Р).
Выполнив преобразования, получаем:
Х = 2 * (1 - Р).
В нашем частном случае, Р = 0,9,
получим решение:
Х = 2 * (1 - 0,9) = 0,2.
Вот предложение по решению первой части проблемы: Мат ожидание стратегии ясновидящего есть моя формализация интуитивного понятия "оптимальная стратегия для этой игры". Теперь я поясню точный смысл этого определения и, заодно, попробую убедить читателя, что это определение и есть абсолютно лучшая формализация вообще.
ОтветитьУдалитьДля начала давайте стандартизируем обозначения, чтобы мы все говорили на одном языке.
N - количество раундов, которое нам разрешено сыграть в эту перспективную игру. Если мы вообще соглашаемся играть в эту игру, то мы должны играть ровно N раз.
K - количество удач
M - количество неудач
P(K,M) - вероятность K удачных и M неудачных раундов, K+M=N
p - вероятность удачи в каждом раунде (у Ильи 0.9)
q - вероятность неудачи в каждом раунде (у Ильи 0.1)
V - начальный капитал
W - конечный капитал
x - подвергаемая риску доля общего капитала, х ∈ [0,1]. Будьте внимательны: у Ильи х означет запасную долю капитала!
С - стратегия простого смертного
S - стратегия ясновидящего
Что такое стратегия ясновидящего? Представьте себе, что человеку умеющему абсолютно точно предсказывать будущее, предложили сыграть в эту игру. Этот человек заглянул в будущее перед тем как сыграть и увидел, что он выиграет К раз и проиграет M раз. В лексиконе ясновидящего нет такого понятия как риск, потому что риск по определению сопряжен с неопределенностью, а у нашего ясновидящего нет никакой неопределенности. Следовательно, у ясновидящего нет никакой проблемы или неопределенности с выбором лучшей стратегии: просто надо выбрать значение х, доставляющее максимум конечному капиталу.
Лемма 1 Конечный капитал ясновидящего: W(K,M;х) = V*(1+х)^K*(1-x)^M.
Доказательство: Ежу понятно.
Лемма 2 Лучшая стратегия ясновидящего абсолютно детерминирована: Если K>M, то x=(K-M)/(K+M), в противном случае х=0. Или на формальном математическом языке: S(K,M)={x=θ(K-M)*(K-M)/(K+M)}, где θ - единичная лестничная функция (0 - при отрицательном аргументе, 1 - при положительном аргументе).
Доказательство: Ежу понятно.
Теперь возникает естественный вопрос: Лучшая стратегия ясновидящего не вызывает сомнений, но что есть лучшая стратегия простого смертного человека? Естественный вопрос должен иметь естественный ответ. В данном случае естественный ответ напрашивается сам: Мат ожидание стратегии ясновидящего, т.е.
C(N)=ΣP(K,M)S(K,M)
Мне остается показать на всевозможных конкретных примерах, что мой подход не ведет к логически несуразным выводам ни при каких комбинациях параметров задачи. Если мой подход действительно абсолютно лучший из всех возможных, то он не должен давать явно противоречащие здравому смыслу выводы ни при каких значениях N.
Результаты проверки этого метода на вшивость я представлю в следующий раз. Между тем, буду весьма благодарен читателю, если он сможет получить явно абсурдное логическое следствие этого метода, или какое-то противоречие выводов этой философии с хорошо установленными результатами предыдущих исследователей.
Не понятно что такое S(K,M) - какие значения она принимает? - булевские что ли true\false? Тогда как их суммировать и перемножать? Чему она равна при некоторых N.
УдалитьПоясните поподробнее о чем лемма 2.
Злой анонимный Х.
> Не понятно что такое S(K,M) - какие значения она принимает? - булевские что ли true\false? Тогда как их суммировать и перемножать? Чему она равна при некоторых N.
ОтветитьУдалитьВыражение S(K,M)={x=θ(K-M)*(K-M)/(K+M)} действительно не очень удачное и требует пояснений. В чем вообще состоит стратегия (S или С)? Стратегия состоит просто в выборе х. Выражение S(K,M)={x=θ(K-M)*(K-M)/(K+M)} просто означает, что х надо выбрать равным θ(K-M)*(K-M)/(K+M). Другими словами S(K,M) есть самая обычная функция двух целых переменных, значение которой просто равно значению х, т.е. S(K,M)=θ(K-M)*(K-M)/(K+M).
Стратегия же простого смертного С(N) есть функция одного целого переменного и заключается в выборе х согласно формуле:
х(N)=ΣP(K,M)*θ(K-M)*(K-M)/(K+M), где суммирование производится по всем возможным парам K и M, дающим в сумме N: K+M=N.
Чтобы стало совсем понятно, давайте распишем это решение для конкретного случая:
N=2
p=0.9
q=0.1
Чему равно оптимальное значение х в этом простом конкретном случае? Расписываем решение:
S(2,0)=θ(2-0)*(2-0)/(2+0)=1.
S(1,1)=θ(1-1)*(1-1)/(1+1)=0.
S(0,2)=θ(0-2)*(0-2)/(0+2)=0.
P(2,0)=0.9*0.9=0.81
P(1,1)=0.9*0.1+0.1*0.9=0.18
P(0,2)=0.1*0.1=0.01
х(2)=0.81*1+0.18*0+0.01*0=0.81
В словах ответ звучит так: Если нам разрешили играть в эту игру два раза (N=2), то надо подставлять под риск 81% капитала.
В простейшего случая N=1, мое решение дает оптимальное значение х=0.9, т.е. если нам разрешили играть в эту игру только один раз, то надо подставлять под риск 90% капитала.
Я еще не подсчитывал, но если мое решение невшивое, то оно должно иметь асимптотически правильное поведение: х → (p-q)/(p+q) при N → ∞. В частности, если р=0.9 и =0.1 (как у Ильи), то должна получиться такая асимптотика: х → 0.8 при N → ∞.
>Поясните поподробнее о чем лемма 2.
Лемма 2 просто утверждает, что финальный капитал ясновидящего, т.е. V*(1+х)^K*(1-x)^M, достигает максимума при x=θ(K-M)*(K-M)/(K+M).
>>В простейшего случая N=1, мое решение дает оптимальное значение х=0.9, т.е. если нам разрешили играть в эту игру только один раз, то надо подставлять под риск 90% капитала.>>>
УдалитьМне вот это утверждение кажется не совсем логичным...
Действительно, мы оставляем некоторую сумму в резерве, но только лишь для того, чтобы иметь возможность продолжать игру, если уже в первом туре нас постигнет фиаско.
Если же предполагается всего одна игра, пан-или-пропал, play-off, то смысла в этом резерве нет.
>Действительно, мы оставляем некоторую сумму в резерве, но только лишь для того, чтобы иметь возможность продолжать игру, если уже в первом туре нас постигнет фиаско.
УдалитьЛукомор, спасибо за интересное возражение, но мне думается, что это не совсем так: иметь резерв даже при N=1 отражает житейскую мудрость огромной важности. А мы ведь в наших поисках оптимальной стратегии исходили именно из требований интуиции и здравого смысла.
Например, представьте себе, что ваш исходный капитал составляет большую сумму, скажем 10 миллионов долларов для пущей выпуклости мысли. Тогда со стратегией, которая вам кажется самой разумной (все или ничего) есть 10% шанс, что из князей вы прямо пойдете в грязи. А между прочим, 10% это не такой уж малый риск, т.е. у вас есть реальный шанс из мультимиллионера превратиться в нищего в одночасье. При моем же подходе вы с вероятностью 1 останетесь миллионером и, в худшем случае, можете продолжать жить лучше, чем 99.99% своих сограждан. А если повезет, то у вас будет мои 19 миллионов против ваших 20 миллионов со стратегией "пан или пропал", т.е. разница практически ничтожная для мильтимиллионера.
Полагаю, что моя идея выдержала с честью первое и очень серьезное испытание на вшивость.
Кроме отсылок к житейской мудрости, есть еще соображения. Играть ва-банк при вероятности выигрыша 90% -- это каждый понимает. Но что если эта вероятность равна 50% (то есть рулетка)? Тогда для одних стратегий ставить все и не ставить ничего одинаково приемлемо, а для других (в частности для матожидания стратегии ясновидящего) оптимально поставить половину. Второй вариант более гибок, и поэтому кажется более релевантным задаче.
Удалить> Но что если эта вероятность равна 50% (то есть рулетка)? Тогда для одних стратегий ставить все и не ставить ничего одинаково приемлемо, а для других (в частности для матожидания стратегии ясновидящего) оптимально поставить половину.
УдалитьSophist, как вы пришли к такому выводу? Если я не ошибся в расчетах по моей же методике, то матожидание стратегии ясновидящего дает в этом случае х=0, т.е. не играть вообще. Что, между прочим, прекрасно согласуется со здравым смыслом: при р=q=1/2 и N=1 рисковать всем это просто безумие, а рисковать малым при многократном повторе игры - это менять шило на мыло, т.е. пустая трата времени.
Sophist, вы совершенно правы. При р=q=1/2 и N=1 матожидание стратегии ясновидящего действительно дает х=1/2. И это, как вы уже отметили, кажется более релевантным задаче.
УдалитьСпасибо за этот испытательный тест, который похоже мы тоже выдержали.
> Если я не ошибся в расчетах по моей же методике, то матожидание стратегии ясновидящего дает в этом случае х=0, т.е. не играть вообще.
УдалитьВо избежание недоразумений, хочу отметить, что речь идет о случае р=q=1/2, а N → ∞.
Arthur Baraov Apr 13, 2012 09:27 AM
УдалитьЛукомор, спасибо за интересное возражение, но мне думается, что это не совсем так: иметь резерв даже при N=1 отражает житейскую мудрость огромной важности.
_____________________
Если N=1 то резерв никогда, ни при каких обстоятельствах не участвует в игре.
Поэтому, если я поставил $10 на красное, то я либо получу $20, либо потеряю свои $10.
Этот результат единственной игры не зависит от того, поставил ли я половину своих денег, или миллионную их часть.
>>Полагаю, что моя идея выдержала с честью первое и очень серьезное испытание на вшивость.>>>
ОтветитьУдалить-------------------
Полагаю, что в сумму начального капитала перед первой и единственной игрой, не следует включать все имеющиеся активы, банковские депозиты, оценки стоимости движимого и недвижимого имущества игрока. Т.е. речь в задаче не идёт о полном и безоговорочном разорении игрока за один тур игры.
Естественнее будет считать, что весь его стартовый капитал, это всего лишь сумма денег, выделенная именно на развлечения, в частности, на азартные игры.
Потеря всей этой суммы досадна, но не фатальна. Ведь игра всё равно планировалась лишь одна, независимо от исхода. Разница лишь в том, что проиграв, идём домой пешком, а выиграв, едем на такси. :)
Суперская задача. Много думал, много разных выводов, осталось много неясности, поделюсь.
ОтветитьУдалитьВ общем, перейду сразу к сути.
Математическое ожидание - это некий аналог арифметиского среднего. А ведь есть ещё и геометрическое среднее. Посчитаем геометрическое математическое оиждание.
х - доля ставки
ГМО = (1+x)^0.9 * (1-x)^0.1
1+x - банк после выигрыша.
1-x - банк после проигрыша.
достигает максимума при 80%. гмо=1.4449 мо=1.64
обратим внимание на полученые значения
1.8 - банк после выигрыша
0.2 - банк после проигрыша
соотношение банков равно соотношению вероятностей этот банк сорвать
формулировку "геометрическое мат. ожидание" нашел в какой-то книге по управлению капиталом, реинвестирование. как видим, при наличии хотя бы одного исхода со значением 0 гмо будет равно нулю. То есть при поиске оптимальности с помощью ГМО получится безпроигрышная стратегия.
подолью масла в огонь! вспомним задачу "парадокс двух конвертов", сосчитаем гмо при смене конверта, и без смены конверта. они равны, парадокса нет)
а теперь вопросы
что показывает величина ГМО? что такое это гмо и для каких задач мы можем его применять? а для каких не можем? на какие вопросы отвечает гмо, а на какие мо? может мо не может быть применено к "парадоксу двух конвертов"? почему? для каких "оптимально" используем МО, а для каких - ГМО? и тд и тп
Luxo, идею использовать среднее геометрическое (ГМО) вместо среднего арифметического(МО) выдвинул тот же самый Даниил Бернулли в той же самой статье, где он предложил свое решение Санкт-Петербургского парадокса. Как я уже отмечал, этот подход является типичным ad hoc. Как всякий ad hoc, он трещит по швам за узкими пределами своей применимости, и неизбежно приводит к логическим противоречиям.
УдалитьВ конкретном случае Санкт-Петербургского парадокса, где pay-off равен 2^n с вероятностью (1/2)^n, достаточно поменять pay-off на 2^(2^n), оставляя вероятность той же, и парадокс возвращается как ни в чем не бывало.
Рискуя быть осужденным за излишнюю самонадеянность и нескромность, скажу, что решение 299-летней Санкт-Петербургской проблемы, не опирающееся на концепцию утилиты и свободную от связанных с ней логических противоречий, будет опубликовано в этом году в трудах международной конференции "Bayesian Inference and Maximum Entropy Methods in Science and Enginnering", которая состоялась в июле 2011 года в Канаде:
On the Notion of Fair Games and Bernoulli's Concept of Moral Expectation
Если Илья заинтересуется и сочтет, что тема Санкт-Петербургского парадокса заслуживает внимания его читателей в форме отдельной заметки, я с удовольствием пришлю ему полный текст моего решения этой знаменитой проблемы. Между прочим, в упомянутой статье я выдвинул абсолютно новую идею дробного хода в шахматах, с целью сделать эту игру идеально симметричной и вдохнуть в древнюю игру новую жизнь.
Таки да, для парадокса двух конвертов достаточно поместить в конверты суммы х и x^2, и парадокс снова на месте.
УдалитьСовершенно верно. Но не огорчайтесь, Luxo, на парадокс двух конвертов у нас тоже найдется управа. Мы скоро разберемся с этим твердым орешком так, что не только комаръ, но даже ЗлойХ с Wanderer логического носу не подточатъ :)
УдалитьРешение проблемы двух конвертов будет впервые опубликовано не в докладах Санк-Петербургской Академии Наук или Гарвардского Университета, а прямо здесь в Трудах "ПРИВЫЧКА НЕ ДУМАТЬ".
>>>LuxoApr 13, 2012 11:37 PM
УдалитьТаки да, для парадокса двух конвертов достаточно поместить в конверты суммы х и x^2, и парадокс снова на месте.>>>
__________
Парадокс "парадокса двух конвертов" заключается в том, что при любом соотношении сумм в конвертах, даже случайном, меняющемся от тура к туру,
тот, кто постоянно вскрывает второй конверт, не имеет преимущества перед тем, кто не вскрывает его никогда.
LuxoApr 13, 2012 12:30 PM
Удалитьчто показывает величина ГМО? что такое это гмо и для каких задач мы можем его применять? а для каких не можем? на какие вопросы отвечает гмо, а на какие мо? может мо не может быть применено к "парадоксу двух конвертов"? почему? для каких "оптимально" используем МО, а для каких - ГМО? и тд и тп
_____________________
На мой взгляд, тут дело в размерностях...
Если мы считаем в линейных единицах: долларах, метрах, амперах, секундах, то лучше использовать среднее арифметическое.
Если же используется единица измерения "разы", то есть величина нелинейная, то лучше будет взять среднее геометрическое.
Просто потому, что "разы" не складывают и вычитают, а умножают и делят.
Как-то так...
Артур,
ОтветитьУдалитьИдея с ясновидящим - блестящая. Но вот казалось бы, раз уж он ясновидящий, то должен знать наперед не только число K, но и исход каждой конкретной партии. Тогда для выигрышных партий он будет выбирать x=1, а для проигрышных x=0. А тогда матожидание стратегии ясновидящего получится x=p.
Нет, по правилам игрок должен выбрать один x на всю серию игр.
УдалитьДмитрий, спаибо на добром слове. Но аноним выше конечно прав:
Удалить(1) х выбирается до начала игры на всю партию;
(2) потом я не зря специально напомнил, что если мы вообще соглашаемся играть в эту игру, то мы должны играть ровно N раз (иначе хитрый ясновидящий мог выйти из игры раньше времени если он увидел, что последий раунд проигрышный);
(3) а самое главное, конечно, я ввел ясновидящего просто ради ясности изложения основной идеи метода. Выражаясь на веселом языке моего любимого литературного героя: "Автомобиль -- не роскошь, а средство передвижения."
Потребовалась пара сотен лет, чтобы научная общественность в целом сумела оценить по достоинству величие идеи Даниила Бернулли о "моральном ожидании". А величие и истинный смысл Laplace's rule of succesion до сих пор вообще не осознаны "частотниками". По всей вероятности, такая же судьба уготована идее вашего покорного слуги о "матожидании ясновидящего".
Сказав это, я немдленно вспомнил анекдот, который рассказал нам, студентам физтеха, лектор по теоретической механике: Решением проблемы трех тел занимались Леонард Эйлер, Жозеф Луи Лагранж, Софья Ковалевская и я.
Мы все хорошо потрудились, теперь можно слегка расслабиться и повеселиться. Делу - время, потехе час.
УдалитьКак разоблачить претендующего на ясновидение человека? Есть много способов. Мне нравится вот этот, который я называю французским методом.
- Значит, вы говорите, что вы ясновидящий и можете предвидеть будущее?
- Точно, я могу видеть будущее.
Затем следует сочная затрещина, от которой "ясновидящий" валится на пол, и вопрощающий назидательно добавляет:
- А это? Вы это предвидели? Как видите, не так уж трудно разоблачить лжеца!
Дмитрий сделал комментарий, который почему-то не прошел, но я вижу его в моем почтовом ящике поскольку я подписался на эту заметку (рекомендую всем сделать то же самое). В нем очень много очень хорошх замечаний и вопросов. Вот они.
Удалить> В подобного рода случаях на судьбу можно повлиять только терпеливой разъяснительной работой. Причем, с упором не столько на величие, сколько на истинный смысл. А он и в самом деле не всегда очевиден.
Очень верно подмечено.
> Сама по себе величина (s+1)/(n+2) вполне себе вписывается в классическую матстатистику, т.к. по сути является некоторой статистической характеристикой, и ничто не мешает изучить ее классические свойства (дисперсию оценки, в частности). Явно позитивный момент - в том, что хотя бы чисто арифметически формула дает какой-то определенный ответ при n=0, что для классической статистики нехарактерно.
Прежде я хотел бы отметить, что ответ при n=0 не просто какой-то, а единственно возможный с точки зрения логической непротиворечивости. Это очень важно. То же самое верно для n=1,2,3... Потом, что еще важнее, не следует думать, что ответ который дает rule of succesion для n=0 или n=1 более низкого качества, чем ответ при n=1000. Все эти ответы единственно правильные и единственно возможные с точки зрения логической непротиворечивости. Осознание этого простого факта есть барьер, преодоление которого почему-то оказывается практически невозможным для студента, привыкшего ассоциировать понятие вероятности с повторением чего-то.
Почему я все время говорю как заведенный попугай: "единственно возможный с точки зрения логической непротиворечивости"? Почему бы мне не попытаться доказать это? Я не только пытался, я уже доказывал это. Повторю еще раз. Берем очень несимметричную монету с двумя сторонами: орел и решка. Это все, что мы знаем об этой монете. Чему равна вероятность выпадения орла? Честный "частотник" ответит вам: я не знаю. А Лаплас с абсолютной убежденностью скажет: 1/2. Почему этот ответ является правильным и единственно возможным с точки зрения логической непротиворечивости. Да потому что у нас полная симметрия между орлом и решкой. После такого ответа "частотник" начинает подозревать что вы сумасшедший. Почему? Потому, что он думает в терминах "физической" вероятности и прекрасно помнит, что монета несимметричная. А мы на полном серьезе говорим ему, что симметрия между орлом и решкой идеальная. Мы понимаем, что "частотник" думает в категориях "физической" или "объективной" или "истинной" вероятности, но он никак не понимает, или не хочет понимать, что мы думаем в категориях информации. С информационной же точки зрения симметрия между орлом и решкой абсолютно идеальная - у нас нет ни малейшего основания думать, что орел имеет больше "прав" или "оснований" для выпадения по сравнению с решкой. Если бы мы так думали это и означало бы, что мы противоречим самим себе. Поэтому когда Лаплас говорит, что р(орла)=р(решки) это просто признание очевидного факта ИНФОРМАЦИОННОЙ симметрии. Доказать, что ответы, которые дает rule of succesion для n>0 точно также являются единственно правильными и единственно возможным с точки зрения логической непротиворечивости труднее, но можно. Поверьте мне.
Продолжение следует.
Дальше Дмитрий задает очень важный и очень хороший вопрос:
Удалить>Но как оценить пригодность такой оценки для практического применения? В примере с орлом/решкой результат еще как-то интерпретируем. А вот если в качестве событий рассматривать, упадет ли монета плашмя или встанет на ребро? Интуиция противится принимать ответ 1/2.
И правильно делает что противится. А почему она противится? Очень просто: интуиция ЗНАЕТ (информация, дорогой Дмитрий, информация) что нет ИНФОРМАЦИОННОЙ симметрии между "упадет плашмя" и "встанет ребром". "Беда" в том, что интуиция не только знает слишком много, но также честно пытается учесть всю эту огромную информацию, когда оценивает вероятность того или иного события. Чтобы убедиться в этом достаточно изменить ваш вопрос чуть-чуть: А вот если в качестве событий рассматривать, упадет ли метеорит сикарамумбой или мумбаракотой? Будет теперь интуиция противится принимать ответ 1/2?
Вы можете возразить, да но я хочу применить ваше хваленное rule of succession к проблеме "упадет плашмя" или "встанет ребром". Почему это великое правило дает такой нелепый результат в этом случае? Да потому, что вы не поняли rule of succession и поэтому не знаете как его применять. Не обижайтесь пожалуйста, Дмитрий, но это все равно, что пытаться зарезать овцу рукояткой кинжала - результат получится очень плохой. Но а как же правильно применять это правило? Может хватит кривляться и пора объяснить?
Давайте попробуем. Сколько раз вы (и не только вы) бросали монету и видели, что она упала плашмя и сколько раз встала ребром? Это информация? Да конечно это информация. Эта информация имеет прямое отношение к обсуждаемой проблеме? Вне всяких сомнений. Эта информация доступна интуиции? Конечно. Интуиция учитывает эту информацию? Безусловно. А вы, когда применяли rule of succession к этой проблеме, учли эту информацию? Нет, дорогой Дмитрий, не учли - вы резали овцу рукояткой кинжала. Что же вы удивляетесь абсурдному результату!
Допустим вся информация, которой вы владеете по данной проблеме, состоит в том, что вы знаете (сами бросали монету+информация из других источников), что монета упала плашмя 1000 раз и встала ребром 2 раза. Вот и впрягите эту информацию честно в rule of succession. Очень важно не забывать при этом, что интуиция использует гораздо больше информации, гораздо более тонкого характера, чем простой подсчет "плашмей" и "ребер", учесть которых rule of succession к сожалению не может. Но правильное использование rule of succession никогда не даст результата противоречащего интуиции при условии, что интуиция не пользуется дополнительной информацией, которую вы забыли (или, к сожалению, невозможно) впрячь в rule of succession.
Мне пора спать. Продолжу потом.
Интересно как получилось. Артур прочитал мой комментарий, а я сам его не вижу. Причем вчера он появился на странице. Мне-то это и не так важно - я и сам помню, что сказал, но если и другие не видят, то им может быть непонятно, на что Артур отвечает. Это с моей стороны неполадки или в блоге что-то глюкнуло? Раньше такого не случалось.
УдалитьИлья, сайт чудит: Дмитрий сделал комментарий, который почему-то не прошел, но я вижу его в моем почтовом ящике поскольку я подписался на эту заметку (рекомендую всем сделать то же самое). В нем очень много очень хорошх замечаний и вопросов. Вот они.
Удалить> В подобного рода случаях на судьбу можно повлиять только терпеливой разъяснительной работой. Причем, с упором не столько на величие, сколько на истинный смысл. А он и в самом деле не всегда очевиден.
Очень верно подмечено.
> Сама по себе величина (s+1)/(n+2) вполне себе вписывается в классическую матстатистику, т.к. по сути является некоторой статистической характеристикой, и ничто не мешает изучить ее классические свойства (дисперсию оценки, в частности). Явно позитивный момент - в том, что хотя бы чисто арифметически формула дает какой-то определенный ответ при n=0, что для классической статистики нехарактерно.
Прежде я хотел бы отметить, что ответ при n=0 не просто какой-то, а единственно возможный с точки зрения логической непротиворечивости. Это очень важно. То же самое верно для n=1,2,3... Потом, что еще важнее, не следует думать, что ответ который дает rule of succesion для n=0 или n=1 более низкого качества, чем ответ при n=1000. Все эти ответы единственно правильные и единственно возможные с точки зрения логической непротиворечивости. Осознание этого простого факта есть барьер, преодоление которого почему-то оказывается практически невозможным для студента, привыкшего ассоциировать понятие вероятности с повторением чего-то.
Почему я все время говорю как заведенный попугай: "единственно возможный с точки зрения логической непротиворечивости"? Почему бы мне не попытаться доказать это? Я не только пытался, я уже доказывал это. Повторю еще раз. Берем очень несимметричную монету с двумя сторонами: орел и решка. Это все, что мы знаем об этой монете. Чему равна вероятность выпадения орла? Честный "частотник" ответит вам: я не знаю. А Лаплас с абсолютной убежденностью скажет: 1/2. Почему этот ответ является правильным и единственно возможным с точки зрения логической непротиворечивости. Да потому что у нас полная симметрия между орлом и решкой. После такого ответа "частотник" начинает подозревать что вы сумасшедший. Почему? Потому, что он думает в терминах "физической" вероятности и прекрасно помнит, что монета несимметричная. А мы на полном серьезе говорим ему, что симметрия между орлом и решкой идеальная. Мы понимаем, что "частотник" думает в категориях "физической" или "объективной" или "истинной" вероятности, но он никак не понимает, или не хочет понимать, что мы думаем в категориях информации. С информационной же точки зрения симметрия между орлом и решкой абсолютно идеальная - у нас нет ни малейшего основания думать, что орел имеет больше "прав" или "оснований" для выпадения по сравнению с решкой. Если бы мы так думали это и означало бы, что мы противоречим самим себе. Поэтому когда Лаплас говорит, что р(орла)=р(решки) это просто признание очевидного факта ИНФОРМАЦИОННОЙ симметрии. Доказать, что ответы, которые дает rule of succesion для n>0 точно также являются единственно правильными и единственно возможным с точки зрения логической непротиворечивости труднее, но можно. Поверьте мне.
Продолжение следует... выше (сайт чудит)
Коллеги,
Удалитьанти-спам фильтры гугла иногда скрывают сообщения, которые показались им подозрительными. Как только у меня появляется возможность, я тут же возвращаю их обратно (привычно удаляя массу дублей, потому что вы успеваете отправить много одинаковых сообщений).
Без этого, к сожалению, нельзя, так как в сети очень много роботов, оставляющих рекламные сообщения. Благо, такие казусы происходят редко (считанные разы в месяц хорошее сообщение случайно попадает в "скрытые"). Надеюсь, у вас хватит терпения на такие внезапные, но редкие случайности.
Допустим вся информация, которой вы владеете по данной проблеме, состоит в том, что вы знаете (сами бросали монету+информация из других источников), что монета упала плашмя 1000 раз и встала ребром 2 раза. Вот и впрягите эту информацию честно в rule of succession.
УдалитьДа, но это уже выход за рамки случая n=0. А вот если предположить, что я миллионер, только что с удивлением узнавший, что помимо пятитысячных купюр бывают деньги и помельче? Вот смотрю на монету, как на диковинку, и пытаюсь оценить вероятности: плашмя упадет или на ребро? Вот в таком случае 1/2 - это единственно правильный ответ? И даже не в этом суть вопроса. Пусть нас таких двое. Я, уже знакомый с правилом Лапласа, говорю 1/2. А оппонент не соглашается и говорит 1/4. Каков механизм справедливого разрешения такого спора?
Продолжим дискуссию с Дмитрием. Возможно, что Дмитрий никогда не проводил эксперимент с монетой, и ему не известны результаты подобных экспериментов, проведенных другими. Тогда rule of succesion даст ответ р(плашмя)=р(ребром)=1/2, с чем его интуиция будет все равно очень сильно сопротивляться. Почему? Я уже дал ответ на этот вопрос, смысл которого, я уверен, дошел не до всех:
Удалить> Очень важно не забывать при этом, что интуиция использует гораздо больше информации, гораздо более тонкого характера, чем простой подсчет "плашмей" и "ребер", учесть которых rule of succession к сожалению не может.
Что же эта за информация, которая настолько тонкая, что rule of succession к сожалению принять во внимание не может, а интуиция пользуется ею почти с такой же легкостью, как она пользуется прямой статистической информацией о количестве "выпадений плашмя" и "вставания ребром" именно МОНЕТЫ? Я абсолютно убежден, что Дмитрий, если даже он не провел ни одного эксперимента в жизни с монетой, держит в голове огромное количество информации о характере падения тел ВООБЩЕ на планете Земля. Мозг Дмитрия не только держит это огромное богатство информации, как груда хлама на чердаке. Мозг Дмитрия, подозревает он сам об этом или нет, давно успел систематизировать эту информацию тем или иным способом.
Я не знаю точно как мозг Дмитрия делает это. Более того, я не знаю точно как мой мозг делает это. Но я абсолютно убежден, что мозг любого человека делает это. Но я, по крайней мере, подозреваю как мой мозг делает это. Например, если вы меня спросите чему равна МОЯ вероятность выпадения двух склееных по основанию кубов "торцом", я отвечу, что она близка к 1/4, но меньше чем 1/4, хотя я таких экспериментов в жизни не проводил. Почему такой ответ? Во-первых, систематизация информации о падении тел ВООБЩЕ моим мозгом такова, что моя интуиция шепчет мне, что наш двойной куб приземлится "торцом" вниз с вероятностью 25% из моего ЗНАНИЯ геометрии (род информации); во-вторых, моя интуиция, обогащенная знанием законов физики (другой род информации), шепчет мне, что вероятность того, что двойной куб, приземлившийся "торцом" вниз, сумеет удержать подобную позицию, меньше, чем вероятность того, что двойной куб приземлившийся "плашмя" вниз сумеет удержат свою позицию.
Приблизителько в таком же духе работает моя интуиция когда она оценивает вероятности для характера падения монеты, т.е. все это я применяю к монете ПО АНАЛОГИИ с двойным кубом. Мозг Дмитрия тоже делает что-то в этом роде, о чем он может подозревать, но не может сам точно объяснить как именно все это происходит в его мозгу. Осознать как именно мозг делает это и попробовать формализовать этот процесс оценки вероятности мозгом и есть открытая проблема теории вероятности в понимании Лапласа, которая и делает ее вечно живой. Классическая же теория умерла в тот самый момент, когда она отказалась от этой великой цели. Классическая теория Колмогорова это как снежная королева - можно восхищаться ее красотой, но любить ее невозможно: она слишком холодная, бездушная и бесплодная. Теория же Лапласа - это как та конопатая и смешливая девчушка из деревни, которую вы полюбили и даже не знаете за что. Она настолко плодотворная, что родит вам Илью Муромца и Золушку.
Продолжение следует.
Итак, как же все-таки правильно применять правило Лапласа при n=0. Вот окончательная инструкция. Правило дает распределение вероятностей для случайного процесса с двумя и только двумя возможными исходами A и B, о которых мы или (1) не знаем абсолютно ничего, или (2) между A и B существует полная информационная симметрия. Ни одно из этих условий практически никогда не соблюдается в жизни в чистом виде - это идеализация. Не пытайтесь применять это “нулевое” правило Лапласа, когда ни одно из этих двух условий явно, или хотя бы приблизительно, не имеет места. В противном случае вы будете очень сильно разочарованы. Не пользуйтесь кухонным ножом в качестве скальпеля – пользуйтесь им только по назначению.
Удалить>И даже не в этом суть вопроса. Пусть нас таких двое. Я, уже знакомый с правилом Лапласа, говорю 1/2. А оппонент не соглашается и говорит 1/4. Каков механизм справедливого разрешения такого спора?
Ответ, который дается “нулевым” правилом Лапласа, не нуждается в экспериментальной проверке, если это то, на что вы намекаете. Скажу больше: этот ответ в принципе не может быть подтвержден или опровергнут с помощью эксперимента. Как только вы проведете первый же эксперимент, сам факт получения информации изменит вероятность, которую вы пытаетесь подтвердить или опровергнуть с помощью эксперимента. Вы чувствуете, дорогой Дмитрий, чем здесь пахнет? Если вы держите нос по ветру, вы уже должны чувствовать запах паленной кошки Шредингера, и чувсвовать как Гейзенберг заворочался в гробу от чрезвычайного волнения.
> А вот при больших n - по каким характеристикам оценка (s+1)/(n+2) превосходит оценку s/n? Ну пусть чем-то лучше. Но все равно выглядит как частотный подход к понятию вероятности. Может быть, это не вполне удачный пример?
УдалитьРазница между (s+1)/(n+2) и s/n ? Как бы это объяснить, не вызывая очередной приступ гнева у ЗлогоХ? Лично я не считаю слишком большим преувеличением сопоставить разницу между (s+1)/(n+2) и s/n при больших n с разницей между двумя неподвижными телами на полу. Разница не видна невооруженным глазом - ее можно оценить по достоинству только пощупав пульс одного и другого. У одного он есть, у другого нет. Один может дать еще потомство, другой нет.
(s+1)/(n+2) - строгий математический вывод; s/n - эмпирика
(s+1)/(n+2) - точная формула; s/n - приближение (а не наоборот)
(s+1)/(n+2) - отсутствие логического противоречия; s/n - ad-hoc
Результат Лапласа (s+1)/(n+2) дает возможность понять, почему частотное определение вероятности работает там, где она работает - многократно повторяющиеся однородные события. Именно этот неоцененный по достоинству, и до сих пор непонятый по настоящему, результат Лапласа искупил первородный грех теории вероятности и дал ей полновесную легитимность.
> Может быть, это не вполне удачный пример? Может, лучше было бы начать с таких примеров, которые показывали бы, какие прежде нерешаемые задачи станут решаемыми благодаря усовершенствованной теории?
Пожалуйста, вот небольшой пример. Илья предлагает Дмитрию выбрать любой из трех запечатанных конвертов с деньгами в пропорции 1:2:4. Дмитрий открывает выбранный наугад конверт и видит 20. Затем, с разрешения Ильи, Дмитрий обменивает свой конверт на любой из тех двух. Какие суммы может Дмитрий увидеть, когда он вскроет этот конверт? Полагаю, он согласится со мной, если я скажу, что вероятность обнаружить в этом конверте любую сумму, отличную от 5, 10, 40 и 80, равна нулю. Теперь я предлагаю Дмитрию найти р(5), р(10), р(40) и р(80) в рамках теории вероятностей, которой его обучали в школе. Когда он найдет их, я хотел бы знать можно ли проверить полученные ответы на экселе. Если да, то как? Если нет, то почему?
Эта задача имеет одно единственное логически непротиворечивое решение. Это решение невозможно получить в рамках частотной теории, и это решение невозможно получить с помощью эксперимента.
Кстати, куда пропал Wanderer? Попытка решить эту задачу на экселе дало бы ему прекрасную возможность понять настоящую теорию вероятностей.
Не пытайтесь применять это “нулевое” правило Лапласа Ну и в чем же тогда сермяжный смысл существования этого правила? Чтоб было чем заполнить эфир?
УдалитьПрежде я хотел бы отметить, что ответ при n=0 не просто какой-то, а единственно возможный с точки зрения логической непротиворечивости.
Грош цена такому заявлению. Единственно возможный логически непротиворечивый ответ на вопрос "какова вероятность события А" - сказать "вероятность события А находится в диапазоне от p1 до p2 с вероятностью p3". Назвать точное значение - это вершина самонадеянности а следовательно и глупости. А в данном конкретном случае при n=0 правильный ответ - "вероятность события А находится в диапазоне от 0 до 1 с вероятностью 100%", который разумеется ни о чем, как впрочем и ответ "1/2" тоже ни о чем, однако его нельзя будет опровергнуть в отличие от Бараовского гадания на кофейной гуще.
Злой анонимный Х.
Ну и в чем же тогда простите сермяга? -
УдалитьВопрошает по-детски злой бедолага.
Чтоб было чем заполнить эфир? -
Продолжает бурчать в желудке кефир.
Я поэт, зовут Незнайка.
УдалитьОт меня Вам балалайка.
(c) Незнайка.
Всезнайка взял дар-балалайку,
УдалитьСочинил в ответ такую байку:
Спасибо родному за балайку,
И завинтил горе-поэту гайку.
... выбрать любой из трех запечатанных конвертов с деньгами в пропорции 1:2:4...
Удалить... открывает выбранный наугад конверт и видит 20.
... найти р(5), р(10), р(40) и р(80) в рамках теории вероятностей.
_____________________________
Легко! Даже с учётом того факта, что я не учил в школе теорию вероятностей.
Я надеюсь, никто не будет возражать против того, что вероятности выбрать конверт с самой маленькой суммочкой Р(1*х), со средней суммой Р(2*х) и с самой большой суммищей Р(4*х) равны и составляют полную группу событий.
Р(1*х)=Р(2*х)=Р(4*х)
Р(1*х)+Р(2*х)+Р(4*х)=1
Эта система из трёх уравнений с тремя неизвестными имеет ровно одно решение:
Р(1*х)=Р(2*х)=Р(4*х)=1/3
Теперь смотрим, что у нас получается при выборе каждого из конвертов.
Если мы выбрали конверт с суммой (1*х)=20, то в двух других конвертах лежат суммы 40 и 80.
Если мы выбрали конверт с суммой (2*х)=20, то в двух других конвертах лежат суммы 10 и 40.
Если мы выбрали конверт с суммой (4*х)=20, то в двух других конвертах лежат суммы 5 и 10.
Отсюда легко получаем искомые вероятности:
р(5)=р(80)=1/6
р(10)=р(40)=1/3
В чём прикол-то?
Лукомор, эта задача является прямым обобщением парадокса двух конвертов. Вы слышали про этот парадокс? Попробуйте приложить логику вашего решения к более простому случаю двух конвертов, и вы легко поймете в чём прикол: подобная логика противоречит здравому смыслу.
Удалить>>Arthur Baraov Apr 19, 2012 11:23AM
УдалитьПопробуйте приложить логику вашего решения к более простому случаю двух конвертов, и вы легко поймете в чём прикол: подобная логика противоречит здравому смыслу.>>
-------------------------------
Это не делает чести здравому смыслу, если подобный здравый смысл противоречит логике!
Случай двух конвертов аналогичен случаю любого количества конвертов, только он гораздо проще. :)
Если в первом вскрытом конверте мы обнаружили $10, то с вероятностью Р=1/2 во втором конверте будет больше денег, и также с вероятностью Р=1/2
во втором конверте будет меньше денег.
Случай полностью симметричный.
Не важно, какой конверт первый, какой второй.
Не важно, вскрывать ли второй конверт, или остановиться на первом.
В чём всё-таки прикол-то?
Если аккуратно построить мат. модель, то никаких парадоксов не будет.
Мне лично нравятся два крылатых высказывания о парадоксах.
1. "Парадоксы существуют не в Природе, а в головах ее исследователей".
2. "Парадокс - это истина, поставленная на голову, чтобы привлечь внимание".
К сожалению не помню, кто авторы этих афоризмов...
> Если в первом вскрытом конверте мы обнаружили $10, то с вероятностью Р=1/2 во втором конверте будет больше денег...
УдалитьЛукомор,
я не понимаю Вас. Если P=1/2, то дальнейшие рассуждения покажут, что всегда выгодно поменять конверт (т.к. средний выигрыш от замены конверта с суммой X равен 1/2 * (2X) + 1/2 *(X/2) = 5X/4). А это противоречит здравому смыслу.
> Если аккуратно построить мат. модель, то никаких парадоксов не будет.
Поэтому утверждение P=1/2 мне и показалось таким странным. Возможно, я не понял Вашу идею. Пожалуйста, поясните, что Вы имели в виду.
>>>Илья Весенний Apr 19, 2012 10:41 PM
УдалитьЛукомор,
я не понимаю Вас.>>>
______________________
Это - нормальное явление, часто я и сам себя не понимаю! :)
Надо отметить, что я не очень-то доверяю подобным фокусам, когда складываются "два раза" и "половина раза" и при этом получается "два с половиной раза". Подобная операция, вообще говоря, далеко не всегда корректна.
Вот наглядный пример некорректного её использования:
Пусть "В" больше "A" в два раза. В свою очередь "С" больше "B" в три раза.
В полном соответствии со "здравым смыслом" складываем: "два раза" плюс "три раза" и получаем, что "С" больше "A" в "пять раз".:)
Поэтому, в задаче о двух конвертах я стою на том, что среднее геометрическое даёт более адекватную оценку среднего выигрыша от смены конвертов, а именно ((2*х)*(х/2))^(1/2)=1.
Эта оценка среднего выигрыша как раз и говорит нам о том, что меняя конверты мы "меняем шило на мыло".
Я не случайно называю получаемую величину не "средним выигрышем", но "оценкой среднего выигрыша", поскольку у нас нет достаточной информации, чтобы вычислить "средний выигрыш".
Точнее будет даже не так. Игрок не может, но мы то можем, вычислить "средний выигрыш".
Для этого мы берём некоторую сумму денег равную S долларов (это важно! - мы сразу всё измеряем в линейных единицах, в долларах, а не в "разах"), и раскладываем их на два конверта в соотношении 1:2, то есть в один конверт мы положим сумму S/3 долларов, а в другой конверт сумму 2*(S/3) долларов.
Игрок с вероятностью Р=1/2 выбирает любой из конвертов, и мат. ожидание суммы в первом конверте составит :
MS=1/2(S/3+2*S/3)=S/2.
Теперь предположим, что игрок решил поменять конверт.
При этом, если у него на руках была меньшая сумма S/3, то он поменяет её на сумму 2*S/3, но если же у него на руках была бОльшая сумма 2*S/3, то он поменяет её на сумму S/3.
Исходя из этих данных, мы теперь можем найти средний выигрыш от смены конвертов, для данного случая это будет среднее арифметическое, потому как мы с самого начала измеряли суммы в линейных единицах, в долларах.
Находим среднее арифметическое суммы во втором конверте:
Sm=(2*S/3+S/3)/2=S/2.
И посрамлённый "здравый смысл" уступает торжествующей логике разума. :)
Теперь об "оценке среднего выигрыша" игроком. Это действительно будет лишь приблизительная оценка, поскольку игрок не знает, какую из двух сумм он извлёк из первого конверта.
УдалитьДля того, чтобы определить, насколько точна оценка, сделанная при помощи {среднего арифметического из "двух разов" и "половины раза"} проделаем такой эксперимент (математика - наука экспериментальная, не забывайте об этом!).
++++++++++++++++++++++++++++++++
Возьмём две пары конвертов, и в одну пару конвертов положим $5 и $10, а в другую пару конвертов $10 и $20.
Теперь рассмотрим четыре возможных случая.
1. Игрок выбрал первый конверт из первой пары конвертов.
У него на руках теперь $5.
Он оценивает выигрыш от смены конверта, как (2.5+10)/2=6.25 долл.
Вскрыв второй конверт он находит там $10.
2. Игрок выбрал второй конверт из первой пары конвертов.
У него на руках теперь $10.
Он оценивает выигрыш от смены конверта, как (5+20)/2=12.5 долл.
Вскрыв второй конверт он находит там $5.
3. Игрок выбрал первый конверт из второй пары конвертов.
У него на руках теперь $10.
Он оценивает выигрыш от смены конверта, как (5+20)/2=12.5 долл.
Вскрыв второй конверт он находит там $20.
4. Игрок выбрал второй конверт из второй пары конвертов.
У него на руках теперь $20.
Он оценивает выигрыш от смены конверта, как (10+40)/2=25 долл.
Вскрыв второй конверт он находит там $10.
+++++++++++++++++++++++++++++++
Эксперимент закончен.
Теперь рассмотрим его результаты.
1. Вскрыв первый конверт четыре раза, игрок получил всего:
5+10+10+20=45 долл.
Эту сумму он имел бы, если бы четыре раза оставил себе первый конверт.
2. Поменяв первый конверт на второй четыре раза игрок получил всего:
10+5+20+10=45 долл.
Эту сумму он имел бы, если бы четыре раза поменял первый конверт на второй.
Но!
3. Четыре раза оценив "ожидание выигрыша от смены конверта", игрок
насчитал, (но не получил!):
6,25+12,5+12,5+25=56,25 долл.
При этом относительная погрешность оценки составляет
56,25/45=1,25, и это число нам подозрительно знакомо.
Эта погрешность в 25% как раз и есть "два раза плюс пол-раза пополам"! :)
4. Если бы мы взяли среднюю геометрическую оценку, мы бы перемножили "разы" на "разы", что, как я уже говорил, более свойственно природе "разов", как единиц измерения, и затем извлекли бы квадратный корень, то мы получили бы в первом опыте оценку $5, во втором и в третьем - $10, и в четвёртом опыте - $20.
Сложив эти четыре оценки, получаем $45, что в точности соответствует результату проведенного нами эксперимента.
Вот, собственно и всё, что мы должны знать: о "парадоксе" двух конвертов, о загадочной единице измерения "разы", и о "здравом смысле", которому противоречит математическая логика.
> В полном соответствии со "здравым смыслом" складываем: "два раза" плюс "три раза" и получаем, что "С" больше "A" в "пять раз".:)
УдалитьЕсли это называть здравым смыслом, то нет никакой необходимости объяснять отличие его выводов от результатов применения математической логики.
Складывает впечатление, что Вы не читали заметку и дискуссии о задаче двух конвертов, поэтому частично повторяете мне мои же слова (или приводите аргументы, на которые я уже неоднократно отвечал). Это нестрашно, но не очень эффективно.
У лукоморья дуб зеленый;
УдалитьЗлатая цепь на дубе том:
И днем и ночью кот ученый
Всё ходит по цепи кругом;
А. С. Пушкин, «Руслан и Людмила»
>Вот, собственно и всё, что мы должны знать: о "парадоксе" двух конвертов
Прелесть парадокса двух конвертов в том, что пажалуй нет ни одного дилетанта, который в первые же десять минут знакомста с парадоксом не “разрешил” его, и не спешил с триумфом объявить всему миру о своем окончательном вердикте. И, как правило, каждый самородок приходит со своим новым окончательным разрешением парадокса, что, как это ни удивительно, никого не настораживает.
Справедливости ради надо отметить, что ваш покорный слуга не избежал этой позорной участи лет семь назад, о которой он предпочитает не вспоминать.
Однако я бегу впереди своего же паровоза. Давайте оставим этот парадокс пока в покое - впереди специальная заметка, посвященная его обсуждению.
Лукомор, вот Артур тут уже подмечал, что вместо 2x можно рассмотреть и x^2. А вообще-то, вместо "разов" можно рассмотреть и произвольные нелинейные функции. В таких случаях и геометрическое среднее адекватно не сработает. Каждый раз придется выдумывать индивидуальные "средние".
УдалитьМеня вот одолели смутные сомнения - а вообще-то, является ли матожидание в этой задаче таким уж безусловным критерием? Небольшой модификацией задачи несложно моделируется p=1/2. Например, так. Сначала каким-то образом формируется первый конверт (по-прежнему, с неизвестным распределением) и вручается игроку. Затем подбрасывается монета и во второй конверт кладется либо вдвое больше, либо вдвое меньше. Игроку предлагается либо оставить себе первый конверт, либо заменить его на второй. Тут уж p=1/2. По критерию матожидания, следует однозначно менять. Однако, я бы не был столь категоричен. Если в первом конверте я вижу сумму, достаточную для реализации какой-нибудь мечты своей жизни (а половины при этом недостаточно), то я не стану эту сумму подвергать 50%-му риску. Если же цена вопроса мелкая, то можно и рискнуть в надежде получить вдвое больше. Выиграю - порадуюсь, проиграю - не расстроюсь. И у разных игроков пороги принятия решений будут разными. Т.е. в решении присутствует субъективный фактор. Для придания решению наукообразности необходимо как-то формализовать портрет игрока, определить характерные для него значения больших и малых денег. Но это уже ближе к нечеткой логике, чем к ТВ.
> Небольшой модификацией задачи несложно моделируется p=1/2. Например, так. Сначала каким-то образом формируется первый конверт (по-прежнему, с неизвестным распределением) и вручается игроку. Затем подбрасывается монета и во второй конверт кладется либо вдвое больше, либо вдвое меньше
УдалитьЗдорово, что Вы это сами придумали. Это и есть та задача, которую обычно решают люди, думающие, что решают исходную задачу. Здесь вероятность p=1/2, поэтому, если требуется максимизировать средний выигрыш, то менять однозначно надо.
> И у разных игроков пороги принятия решений будут разными. Т.е. в решении присутствует субъективный фактор.
Это совсем другая задача получается. Естественно, у неё и решение совсем другое.
Это и есть та задача, которую обычно решают люди, думающие, что решают исходную задачу.
УдалитьА я бы, пожалуй, иначе сформулировал ту, обычно решаемую, задачу. Перед игроком два конверта с разными суммами денег (тут уже не важно их соотношение). Игрок указывает на один из конвертов. Какова вероятность того, что сумма в другом конверте после их вскрытия окажется больше (или меньше), чем в указанном?
Это совсем другая задача получается.
А настолько ли уж другая? Главный вопрос в исходной задаче - не "как максимизировать матожидание?", а, в формулировке Лукомора - "в чем прикол?". При этом парадоксальность создается именно указанием в качестве критерия - максимизации момента первого порядка (в такой формулировке уже не так очевидна безупречность критерия). Ну и плюс легкомысленная манипуляция вероятностями. Думаю, что в задаче неявным образом подразумевается вопрос: а что делать-то в итоге? Какую тактику для игрока рекомендует наука?
>>Дмитрий К. Apr 20, 2012 10:15 AM
УдалитьЛукомор, вот Артур тут уже подмечал, что вместо 2x можно рассмотреть и x^2. А вообще-то, вместо "разов" можно рассмотреть и произвольные нелинейные функции. В таких случаях и геометрическое среднее адекватно не сработает. Каждый раз придется выдумывать индивидуальные "средние".>>
_____________________________________
Действительно, для каждой задачи приходится выдумывать какие-то характеристики.
Особенно плохо с этим делом в физике.
Вот есть множество задач на движение.
Казалось бы всё просто.
Есть интервал времени, и есть пройденный за это время путь.
Казалось бы, чего проще: поделил путь на время, получил среднюю скорость, и все задачи на движение решены.
Но физикам неймётся.
Они выдумали мгновенную скорость, ускорение, но и этого им мало.
Ещё надо было выдумать тангенциальное и центростремительное ускорение и.т.д.
Это была шутка такая, но видимо не от хорошей жизни придумали все эти средние: среднее арифметическое, среднее геометрическое, среднее гармоническое, средневзвешенное, и еще много всяких средних.
Это всё ключики, и каждый ключик открывает свой замочек.
Но для залачи о двух конвертах никакой ключик не нужен вообще.
Её можно решить и без применения каких-либо средних величин.
Скажу больше, неправильно подобранный ключик наглухо застревает в замочке, и не позволяет открыть дверцу.
В частности, для задачи о двух конвертах, как я показал выше, применение среднего арифметического недопустимо вообще.
Мало того, оно ещё и считается неверно.
Если мы аккуратно, без сокращений, выпишем формулу, по которой посчитано в этой задаче среднее ожидание выигрыша, то получим:
(2*X+0.5*Y)/2=(2+0.5)*(X+Y)/2.
Эта формула не верна.
И хотя при Х=Y это равенство выполняется, применять ее нельзя.
Х и У в ней принадлежат разным турам игры.
Х взят из игры, где в конвертах лежат суммы Х и 2*Х.
Ожидание выигрыша для этой игры: MX=(X+2*X)/2=3*X/2.
Y взят из игры, где в конвертах лежат суммы Y и Y/2.
Ожидание выигрыша для этой игры: MY=(Y+Y/2)/2=3*Y/4.
Посчитав МX+MY=(3*X/2+3*Y/4) видим, что M(X+Y) не равно MX+MY.
А должно быть равно...
Качество комментариев явно улучшается, и это радует.
Удалить> В таких случаях и геометрическое среднее адекватно не сработает. Каждый раз придется выдумывать индивидуальные "средние".
Совершенно верно! Именно это я имел в виду, когда говорил, что решение предложенное Даниилом Бернулли для Санкт-Петербургского прадокса - типичный ad hoc, т.е. решение подобранное (правильнее даже сказать - подогнанное) для данной цели, для данного случая. Именно поэтому ad hoc не работает за пределами узкого круга проблем, для решения которых каждая такая подгонка изобретена: ad hoc - решение не основанное на принципе, имеющем более или менее универсальное значение. Принцип мат ожидания случайной величины имеет несравненно большую универсальность по сравнению с принципом маж ожидания логарифма случайной величины (моральное ожидание). Но похоже, что мат ожидание тоже не имеет вселенской универсальности. Почему же тогда, чувствуя себя вправе называть моральное ожидание Бернулли ad hoc, мы никогда не унижаем классическое мат ожидание таким ругательным эпитетом? В чем тут дело?
А дело в том, что мат ожидание работает ВСЕГДА при неограниченном росте количества повторений, для абсолютно ЛЮБОЙ раскладки выплат, в абсолютно ЛЮБОЙ игре. Тогда как моральное ожидание работает только для узкого круга раскладки выплат в игре. После такого заявления меня могут осмеять. Как же так - принцип морального ожидания был предложен Даниилом Бернулли именно потому, что принцип мат ожидания давал сбой в Санкт-Петербургской проблеме?! Потом как насчет проблемы Келли, которой посвящена эта заметка? Разве мы не убедились, что именно при больших N сбой принципа мат ожидания становится наиболее очевидным и неоспоримым, абсолютно гарантируя нам катастрофу при N → ∞ ?!
Хорошие вопросы, неправда ли. Я не хочу лишать читателя интеллектуального удовольствия подумать и найти разгадку этого клубка противоречий.
> А я бы, пожалуй, иначе сформулировал ту, обычно решаемую, задачу. Перед игроком два конверта с разными суммами денег (тут уже не важно их соотношение). Игрок указывает на один из конвертов. Какова вероятность того, что сумма в другом конверте после их вскрытия окажется больше (или меньше), чем в указанном?
УдалитьДмитрий все-таки проигнорировал мою просьбу и, заломив руки, бросился сам под поезд.
Ежу понятно, что правильный ответ в задаче, которую Дмитрий только что придумал, 1/2. Эта не та вероятность, которая нас, и всех остальных, интересует в парадоксе двух конвертов. Даже объяснить в чем суть проблемы нелегко даже такому сообразительному (без всякой иронии) человеку как Дмитрий. Во-первых, выбранный игроком конверт он ОТКРЫВАЕТ. Во-вторых, он видит Х долларов. В-третьих, спрашивается чему равны вероятности, что при вскрытии второго конверта мы обнаружим Х/2 и 2Х. Вот вероятности, о которых идет речь в проблеме двух конвертов.
Илья Весенний Apr 20, 2012 09:29 AM
УдалитьЕсли это называть здравым смыслом, то нет никакой необходимости объяснять отличие его выводов от результатов применения математической логики.
______________________________
Но ведь именно так и подталкивает нас решать задачу то, что вы называете "здравым смыслом".
Иными словами, вы можете объяснить, почему "два раза плюс три раза" это не правильно, а "два раза плюс пол-раза" это правильно?
Вот такой простой вопрос:
На столе два конверта, за столом два игрока.
Каждый берёт по конверту.
Первый найдя 10 долларов, полагает, что во втором 12,5 доллара.
Второй, найдя у себя 20 долларов, полагает, что у первого 25 долларов.
Всего в двух конвертах 30 долларов, так почему же два игрока думают, что у них на двоих 37.5 долларов, а не тридцать?
Ответ простой: их оценка неверна.
Где ошибка?
Артур,
УдалитьНу все правильно, при чем тут поезд? Мы с Ильей немного разошлись во мнениях по формулировке задачи, которой обычно подменяют исходную, думая при этом, что решают-таки исходную. Да, речь идет об условных вероятностях, совершенно верно.
> А настолько ли уж другая?
УдалитьАбсолютно другая! Я дам хорошую подсказку, если вы сможете оценить ее по достоинству. Представьте себе следующие две задачи. В первой требуется найти решение, которое удовлетворяет дифференциальному уравнению (скажем, уравнение Лапласа Δf = 0) во всем прстранстве с требованием затухания на бесконечности и сингулярностью в одной точке, а во второй требуется найти решение того же самого уравнения с конкретными граничными условиями на некоторой конкретной, заданной, замкнутой поверхности (скажем, в форме яичной скорлупы). Разница - колоссальная!
Похоже я слегка поторопился с утверждением, что качество комментариев явно улучшается.
P.S. Поезд при том, что я предложил и просил настоятельно не обсуждать эту очень важную проблему здесь и раньше времени - будет специальная заметка о проблеме двух конвертов. Давайте не будем разбрасываться.
> Да, речь идет об условных вероятностях, совершенно верно.
УдалитьСовершенно НЕверно! Если бы мы знали, (1) что содержание конвертов формируется согласно какой-то фиксированной плотности распределения вероятностей, и (2) вдобавок эта плотность распределения была задана в задаче, тогда, и только тогда, можно было бы с полным правом сказать, что речь идет об условных вероятностях. Для решения подобной задачи не потребовались бы 80 лет мучительных исканий. Достаточно было бы грамотно применить теорему Байеса.
Эта задача как The Thin Ice - по нему надо идти крайне осторожно.
Совершенно НЕверно! Если бы мы знали...
УдалитьНу хорошо, условной я назвал эту вероятность с известной долей условности - по тому признаку, что это вероятность при условии известного содержимого одного из конвертов. С аналогичной натяжкой ее можно назвать апостериорной - как вероятность после вскрытия конверта (и получения информации о его содержимом). Но и этот термин тоже не привносит понятийной новизны. Так давайте с терминологии и начнем. Как правильно называется вот эта разновидность вероятности? После стольких дебатов пора бы уже и обозначить предмет разговора. Или это тоже впереди паровоза? Но в таком случае в этой теме уже особо и нечего добавить без риска попасть под паровоз.
> Как правильно называется вот эта разновидность вероятности?
УдалитьВероятность, которая интересует нас в проблеме двух конвертов, имеет самое непосредственное и прямое отношение к таким (очень важным для теории вероятности, осознанной как расширение обычной дедуктивной логики с целью охватить индуктивную логику) понятиями как Ignorance and Noninformative Priors и Improper Priors
Дмитрий, вспомните ваши же рекомендации и пожелания:
Удалить> Да вообще-то я вижу, что Вы стараетесь донести идею. Но исключительно на философском уровне. А нужны яркие примеры. Краткие и прозрачные. Чтобы почувствовать разницу.
Именно такой план мы и разработали задолго до того, как вы пришли к подобному же выводу, и с религиозной приверженностью следуем этому плану.
Сначала была философская затравка От Колмогорова к Максвеллу, Лапласу, Байесу. Затем мы обратились к проблеме Келли (эта заметка) - более яркого примера, краткого и прозрачного, придумать трудно. Если судьба (или Дмитрий :-)) не вмешается и не перетасует все наши карты, Илья скоро представит вниманию читателя очередной яркий пример под названием "Стал бы Киса Воробьянинов убивать Остапа Бендера, если бы его в детстве познакомили с теоремой Байеса?". Затем - инша аллах, как говорят турецкие янычары - последует заметка "Кость в горле, или с легким паромом". И наконец на сцены кинотеатров чудесной страны вероятностей выйдет "Ирония мечты, или с нелегким почтовым обменом".
Еще раз убедительно просим вас не лесть в пекло вперед батьки.
Как говорят плохие телеведущие - оставайтесь с нами.
Сегодня вечером на Патриарших будет интер-е-е-е-сная история... Аннушка уже купила подсолнечное масло, и не только купила, но даже разлила.
Михаил Булгаков "Мастер и Маргарита"
Затем мы обратились к проблеме Келли (эта заметка) - более яркого примера, краткого и прозрачного, придумать трудно.
УдалитьДа, но в этой проблеме вероятность была просто задана и имела частотный смысл - ведь нас же интересовала частота наступления события. Это не очень-то вязалось с нападками на "частотников". Сама-то задачка и в самом деле интересная, но в ней как-то особо не ощущалось выхода за рамки классической ТВ. Случайная величина вовсе не обязана иметь конечные моменты любых порядков, в том числе и первого, но это может и не препятствовать сходимости по вероятности. Гораздо ярче в этом смысле выглядел на первый вгляд, казалось бы, более банальный пример с монетой. Ну и конверты тоже ближе к теме.
Если судьба (или Дмитрий :-)) не вмешается и не перетасует все наши карты...
Не имею ни малейшего намерения сорвать интереснейшие публикации. Просто не осознавал такой угрозы.
"Кость в горле...
Про меня, что ли? Или про Злого Х? :-)
Еще раз убедительно просим вас не лесть в пекло вперед батьки.
OK, пусть поезд идет по расписанию.
А я пока начал читать рекомендованную работу Jaynes. Интересно. К сожалению, сейчас напряженно со временем, пока только до второй главы добрался.
Ждем продолжения.
х выбирается до начала игры на всю партию
ОтветитьУдалитьДа, упустил это правило игры. В таком случае возражение снимается.
А величие и истинный смысл Laplace's rule of succesion до сих пор вообще не осознаны "частотниками". По всей вероятности, такая же судьба уготована идее вашего покорного слуги о "матожидании ясновидящего".
В подобного рода случаях на судьбу можно повлиять только терпеливой разъяснительной работой. Причем, с упором не столько на величие, сколько на истинный смысл. А он и в самом деле не всегда очевиден. Сама по себе величина (s+1)/(n+2) вполне себе вписывается в классическую матстатистику, т.к. по сути является некоторой статистической характеристикой, и ничто не мешает изучить ее классические свойства (дисперсию оценки, в частности). Явно позитивный момент - в том, что хотя бы чисто арифметически формула дает какой-то определенный ответ при n=0, что для классической статистики нехарактерно. Но как оценить пригодность такой оценки для практического применения? В примере с орлом/решкой результат еще как-то интерпретируем. А вот если в качестве событий рассматривать, упадет ли монета плашмя или встанет на ребро? Интуиция противится принимать ответ 1/2.
И еще мне непонятно, почему между "частотной" и "правильной" интерпретациями вообще должны возникать какие-либо противоречия? Если речь о расширении теории, то на "сужении" все должно работать одинаково. Вне областей применимости "узкой" теории противоречий не должно быть просто из-за отсутствия конкуренции. Или возможно привести реальные примеры, в которых наблюдаемая частота события при проведении экспериментов будет значительно отличаться от "истинной" вероятности?
Ответы Артура на этот комментарий расположены выше:
Удалитьпервый, второй.
Ответ, который дается “нулевым” правилом Лапласа, не нуждается в экспериментальной проверке, если это то, на что вы намекаете.
ОтветитьУдалитьНет, вовсе не на это. Эксперимент сразу уничтожает условие n=0. Ну да ладно, оставим его пока в покое. В конце концов, при n=0 всегда получается 1/2, значит, у этого случая просто особые условия применимости. А вот при больших n - по каким характеристикам оценка (s+1)/(n+2) превосходит оценку s/n? Ну пусть чем-то лучше. Но все равно выглядит как частотный подход к понятию вероятности. Может быть, это не вполне удачный пример? Может, лучше было бы начать с таких примеров, которые показывали бы, какие прежде нерешаемые задачи станут решаемыми благодаря усовершенствованной теории?
Ответил на этот комментарий до того, как он прошел фильтр: жмите здесь
УдалитьКак только вы проведете первый же эксперимент, сам факт получения информации изменит вероятность, которую вы пытаетесь подтвердить или опровергнуть с помощью эксперимента.
ОтветитьУдалитьВозможно ли тогда серию подбрасываний монеты считать последовательностью независимых испытаний одной и той же случайной величины? И не требует ли тогда переосмысления закон больших чисел?
(s+1)/(n+2) - строгий математический вывод; s/n - эмпирика
(s+1)/(n+2) - точная формула; s/n - приближение (а не наоборот)
(s+1)/(n+2) - отсутствие логического противоречия; s/n - ad-hoc
Так все дискуссии именно из-за того, что это совсем не очевидно. Вот именно это и показать бы с максимальной ясностью.
Илья предлагает Дмитрию выбрать любой из трех запечатанных конвертов с деньгами в пропорции 1:2:4...
Предполагаю, что этим примером Вы намекаете на принцип максимальной энтропии. Или где-то близко к этому. На данном этапе пока что можно еще понять, как это может показать взаимосвязь вероятности и информации. Но каким образом это потребует пересмотра трактовки самого понятия вероятности, я пока еще не догадался.
> Но каким образом это потребует пересмотра трактовки самого понятия вероятности, я пока еще не догадался.
УдалитьА можно было - я дал все подсказки: Решите задачу, затем попробуйте истолковать и обосновать полученное решение в терминах частотной вероятности.
> Так все дискуссии именно из-за того, что это совсем не очевидно. Вот именно это и показать бы с максимальной ясностью.
УдалитьДмитрий, я выступаю в роли стартера, а не монтера. Если в машине есть двигатель, я могу дать зажигание и завести мотор. Но если его там нет, я не могу при всем моем желании вмонтировать его.
Мне показалось вначале, что в вашей машине есть мотор. Неужели я ошибся.
Я могу показать жаждущему, где находится колодезь с чистой родниковой водой, но он должен черпать воду сам. Я еще раз протягиваю руку к колодцу и даю его точные координаты: Probability Theory: The Logic Of Science
Там есть ответы на все ваши вопросы. Но есть способ получше - поверить в свои силы и начать думать самостоятельно в попытке дойти до многого самостоятельно, а не искать кого-то кто объяснит и покажет все с максимальной ясностью. Уверяю вас, этот метод не только несравненно интереснее но и гораздо эффективнее.
Я предлагаю начать вот с чего. Представьте себе черный ящик с девятю белыми и одним черным шаром. Попробуйте забыть все чему вас учили (что очень не легко сделать, между прочим) и понять почему вся ваша интуиция говорит, что вероятность вытащить черный шар равна 1/10. Но почему ваша интуиция так непоколебимо убеждена в этом? Откуда это следует? Что это - определение, теорема, соглашение, эксперимент? Ну что это? Откуда это?
почему вся ваша интуиция говорит, что вероятность вытащить черный шар равна 1/10.
УдалитьА Вы проницательны. Моя интуиция именно так подсказывает. А Ваша?
Но почему ваша интуиция так непоколебимо убеждена в этом? Откуда это следует? Что это - определение, теорема, соглашение, эксперимент? Ну что это? Откуда это?
Да не более, чем следствие из предположения о равномерном распределении вероятностей элементарных событий. Именно для данного вероятностного пространства. Сама по себе теория вероятностей такое распределение никак не регламентирует.
> А Вы проницательны. Моя интуиция именно так подсказывает. А Ваша?
УдалитьДмитрий, мне немножко грустно. Меня огорчает не иронический тон этого высказывания. Я обожаю иронию - без нее жизнь как пища без соли. Еще труднее огорчить меня обзываниями, или злобным ворчанием в духе ЗлойХ. Я даже как-то по своему люблю ЗлобногоХ, или точнее сказать: я люблю с ним фехтоваться. Я лишь надеюсь, что это легкое фехтование доставляет ему тоже удовольствие. Если нет, то зачем фехтоваться ?!
Меня другое огорчает - вам никак не удается вырваться из плена ложных представлений и вспарить в воздух в упоительном полете свободы. Я просил вас забыть про теорию вероятностей, и просто, по дружески, побеседовать со своей интуицией, а вы как отвечаете?
Да не более, чем следствие из предположения о равномерном распределении вероятностей элементарных событий. Именно для данного вероятностного пространства. Сама по себе теория вероятностей такое распределение никак не регламентирует.
Как проницательный человек, как вы проницательно заметили, я вижу в этом высказывании самое трудноискоренимое, самое глубокое заблуждение, которое вообще может существовать у студента теории вероятностей. Не избавившись предварительно от этих кандалов, вы не сможете научиться летать. Вы понимаете о чем я говорю? Возможно вы догадываетесь о чем я говорю, но просто не согласны с этим. Если так, то это пол беды. Но если вы даже не догадываетесь, о чем я говорю, тогда я боюсь, что мои пояснения будут совершенно бесплодными. Поэтому я спрашиваю: вы догадываетесь, что именно имею я в виду, когда говорю о самом главном заблуждении?
вам никак не удается вырваться из плена ложных представлений
УдалитьА Вам это сразу удалось? Ну уж поскольку мне истина так легко не открывается, на данном этапе я готов для начала приложить усилия к тому, чтобы убедиться в ложности имеющихся представлений.
а вы как отвечаете?
Ну так уж Вы вопрос сформулировали:
Что это - определение, теорема...?
Хорошо, пусть это будет просто интуиция, неплохо согласующаяся с экспериментом.
Я просил вас забыть про теорию вероятностей
А зачем, собственно? Она тут никак не мешает. ТВ не имеет никакого отношения к тому, как мы определяем эту вероятность. В какой-то конкретной ситуации она может быть и не равной 1/10. И не уверен, что уместно совсем уж забывать про ТВ, пытаясь оценить вероятность. Тогда уж можно просто назвать любое число и заявить, что именно это я и понимаю под вероятностью.
вы догадываетесь, что именно имею я в виду, когда говорю о самом главном заблуждении?
А вот этим вопросом Вы что именно ставите под сомнение - мою понятливость или ясность своего изложения? А Вы говорите именно то, что имеете в виду - мы все и поймем.
> А Вы говорите именно то, что имеете в виду - мы все и поймем.
УдалитьЯ говорил именно то, что имел в виду чаще, чем я могу припомнить. Однако у меня нет хороших оснований полагать, что кто-то понял. На мой взгляд, есть четыре основные гипотезы, объясняющие такое плачевное состояние дел:
(1) Трудность и тонкость предмета; р=80%
(2) Психологический фактор (в частности, излишне конфронтационный и самоуверенный стиль моего изложения, который легко может оттолкнуть всякого, кто сразу же не почувствует важность того, о чем идет речь); р=10%
(3) непонятливость нелюбопытного и ленивого читателя; р=6%
(4) Неясность моего изложения; р=4%
Что такое случайность?
О случайных процессах
О теореме Белла
Фундаментальное заблуждение
Эксперимент и вероятность
Вероятность нельзя измерить
Начинаем подбрасывать монету
Что такое вероятность?
Объективность, шмубутивность
Вероятность есть совокупное свойство двух "точек"
Имена, имена, имена
(1) Трудность и тонкость предмета; р=80%
УдалитьМатерия, в самом деле, тонкая.
(2) Психологический фактор (в частности, излишне конфронтационный и самоуверенный стиль моего изложения, который легко может оттолкнуть всякого, кто сразу же не почувствует важность того, о чем идет речь); р=10%
Ну раз уж у Вас такой стиль, то имеет смысл с особенной тщательностью показывать (не только декларировать) важность того, о чем идет речь.
(3) непонятливость нелюбопытного и ленивого читателя; р=6%
Человеческий фактор, однако. Не стоит к нему свысока относиться.
(4) Неясность моего изложения; р=4%
Не стану утверждать, что больше. Ну постарайтесь снизить до p=2%. Да вообще-то я вижу, что Вы стараетесь донести идею. Но исключительно на философском уровне. А нужны яркие примеры. Краткие и прозрачные. Чтобы почувствовать разницу. Вот событие A. Его вероятность в классической трактовке равна p (и это должно быть достаточно очевидно, во всяком случае, несложно). А правильная вероятность q. И объясняется это тем-то и тем-то. И дальше мы можем использовать это значение так-то и так-то. Или вот Вы критикуете "частотную интерпретацию" вероятности. Ну так приведите пример, когда наблюдаемая в эксперименте частота события получается одна, а правильная вероятность при этом совершенно другая. В общем, я предлагаю Вам применить подход, который Илья традиционно практикует в этом блоге.
Дмитрий К.,
Удалитьесли у нас есть данные о распределении (после множества экспериментов), то, естественно, вероятности, вычисленные обсуждаемыми разными подходами будут одинаковыми. Это же расширение, а не изменение. Частотный подход очень хорош (там, где может сработать), он продуман, выверен и т.д. И всегда, когда он может быть применён, его результат совпадёт с любым другим адекватным подходом.
Мы же ведём речь о случаях, когда эксперимент не закончен (или не начат), из-за чего мы не знаем частот. В таких случаях сторонники частотной теории уверены, что вероятность не может быть найдена. Теория Лапласа же утверждает, что вероятность можно найти осмысленным образом (и объясняет, как это сделать).
Заметка с пояснениями и примерами сейчас готовится.
Дмитрий, спасибо за дельные замечания и полезные советы.
УдалитьЭта заметка всего лишь маленький побочный эффект главного нашего с Ильей проекта. Собственно так и сказано в самой заметке, где в первом же предложении дается ссылка на главную заметку От Колмогорова к Максвеллу, Лапласу, Байесу. У меня складывается впечатление, что вы не читали главную заметку, а если читали то скорее не обратили внимание на следующие слова:
> Мысль, выраженная в общей и абстрактной форме, обычно трудно переваривается. Поэтому давайте в следующей заметке рассмотрим конкретный пример, где мы сможем буквально почувствовать глубинную разницу между классической теорией вероятностей и теорией вероятностей, как логики познания.
Убедительная просьба не бежать по рельсам впереди нашего паровоза - мы не хотим оказаться на скамье подсудимых.
Илья, спасибо за пояснения. Но вот пока что это выглядит больше похожим на plug-in, чем на расширение. Классическая ТВ как работала, так и продолжает. При этом предлагаются новые методы определения вероятностей элементарных событий. Самой-то ТВ безразлично, как мы их определяем - экспериментально, экспертно, точно, приближенно...
УдалитьТеория Лапласа же утверждает, что вероятность можно найти осмысленным образом (и объясняет, как это сделать).
Ясное дело, что если по некоторой методике провести некоторые вычисления, то в итоге получится некоторый результат. Вопрос-то простой (не путать с простым ответом) - на каком основании мы эту величину назовем вероятностью? Т.е. сам предмет разговора получается нечетко обозначенным. Хорошо бы начать с формулировки требований, предъявляемых к этой величине. Например: если впоследствии провести эксперимент, то наблюдаемая частота появления события должна подтвердить вычисленное значение. Это только например - я догадываюсь, что такая формулировка вряд ли подойдет. Ну пусть будет другая. Но столь же внятная. Ведь какая-то же связь с реальностью да должна же быть. Иначе - во имя чего?
Заметка с пояснениями и примерами сейчас готовится.
Убедительная просьба не бежать по рельсам впереди нашего паровоза
Нет-нет, я не Анна К. Рассматривайте просто как пожелания.
> Но вот пока что это выглядит больше похожим на plug-in, чем на расширение. Классическая ТВ как работала, так и продолжает. При этом предлагаются новые методы определения вероятностей элементарных событий. Самой-то ТВ безразлично, как мы их определяем - экспериментально, экспертно, точно, приближенно...
УдалитьХороший комментарий. Дмитрий, и особенно Илья, пожалуйста будьте очень внимательны сейчас. Я где то уже пояснял, что "расширение теории вероятностей" это очень неудачная формулировка того, о чем мы толкуем. Она вводит в заблуждение и не отражает точно и адекватно ту мысль, которую мы пытаемся донести до читателя. Речь идет не о расширении теории вероятностей, речь идет о РАСШИРЕНИИ ФОРМАЛЬНОЙ ЛОГИКИ. Как это сделать и зачем это делать? Что именно расширяется, и что получается в результате такого расширения? Формальная логика - это ЗАКРЫТАЯ, т.е. законченная, теория дедуктивной логики. Дедуктивная логика - это логика самой математики. Область применимости дедуктивной логики невероятно узка - это разделы чистой математики. В других менее формальных областях науки как физика, биология, геология и т.д., не говоря уже о реальной жизни, дедуктивная логика беспомощна и бесполезна как зонт во время урагана. Именно это имел в виду Максвелл, когда он писал:
По общепринятому мнению, эти функции подвластны воле, а воля управляет познанием посредством контроля внимания. Говорят, что понимание должно вырабатываться согласно правилам правильного суждения. Эти правила содержатся или должны содержаться в логике; но в настоящее время логика как наука имеет дело только с утверждениями, которые являются несомненными, невозможными или полностью неопределенными, т. е. с вещами, которых (к счастью) у нас практически никогда не бывает, чтобы делать выводы на их основе. Следовательно, настоящая логика этого мира — это исчисление вероятностей, дающее величину вероятности, которая есть, или должна быть в уме разумного человека.
Называя свой метод дедуктивным, Шерлок Холмс демонстрирует абсолютное непонимание истинного смысла понятия дедукция. Ни один из его "блестящих" умозаключений не может претендовать на эпитет "дедуктивный".
Что же мы надеемся получить в результате расширения, или обобщения, теории дедуктивной логики. Ответ: ОТКРЫТУЮ теорию индуктивной логики. Как это сделать? Это уже сделано. Оказывается, что теория вероятностей Лапласа, где понятие вероятности имеет гораздо более емкую интерпретацию, чем просто частота чего-то, и есть тот самый автомобиль "Антилопа-Гну", который может доставить нас в Черноморск. В чем же заключается это новое содержание старого графина? Вероятность в трактовке теории Лапласа - это степень уверенности агента (в условиях отсутствия информации, достаточной для дедуктивного умозаключения) в достоверности того или иного умозаключения.
Ну тогда вы друзья отделите мух от котлет и зерна от плевел, а то непонятно о чем идет толкование. Начали за здравие, закончили за упокой. Перепешите топики, удалите бред.
УдалитьПредлагаю название топика "От Колмогорова..." переименовать в "От формальной логики сквозь гибкую до дедуктивной" - смысл отражает.
И понятие вероятности здесь не надо портить по сравнению с общепринятым.
Конкретный пример с тем же Лапласом.
Он говорит "Вероятность того что завтра солнце взойдет = 1\2" - вполне себе бредятина по нормальным меркам.
А если бы он сказал "МОЯ уверенность в том что завтра солнце взойдет = 1\2" - точка зрения с правом на существование. И даже с правом на уважение.
"У них это называется точкой зрения, на том и стою." (с) Муравьева
Ключевое здесь слово МОЯ.
Злой анонимный Х
PS
УдалитьКстати, а чем результаты отличаются от результатов fuzzy logic? - не забудьте этот вопрос осветить.
Злой анонимный Х
> ... непонятно о чем идет толкование
Удалить- Нет, - решительно сказал великий комбинатор, - вы произошли не от обезьяны, как все граждане, а от коровы. Вы соображаете очень туго, совсем как парнокопытное млекопитающее. Это я говорю вам как специалист по коровам и копытам. (с) Золотой Теленок
> И понятие вероятности здесь не надо портить по сравнению с общепринятым. Конкретный пример с тем же Лапласом. Он говорит "Вероятность того что завтра солнце взойдет = 1\2" - вполне себе бредятина по нормальным меркам.
Не надо путать себя с Лапласом. Это вы, болван, говорите "Вероятность того что завтра солнце взойдет = 1\2". Великих людей надо аккуратно цитировать, а не приписывать им свою бредятину. Лаплас вот что сказал:
> Thus we find that an event having occured successively any number of times N, the probability that it will happen again the next time is equal (N+1)/(N+2). Placing the most ancient epoch of history at 5000 years ago, or at 182623 days, and the sun having risen constantly in the interval at revolution of 24 hours, it is a bet of 182624 to 1 that it will rise again tomorrow
Но самое главное, Лаплас, предвидя что многие не поймут, что это всего лишь иллюстрация к rule of succession, предусмотрительно добавил:
> But this number [the probability of the sun coming up tomorrow] is far greater for him who, seeing in the totality of phenomena the principle regulating the days and seasons, realizes that nothing at present moment can arrest the course of it.
Jaynes язвительно и с горечью отмечал, что это предупреждение Лапласа было пропущено ослами мимо их длинных ушей.
> Кстати, а чем результаты отличаются от результатов fuzzy logic? - не забудьте этот вопрос осветить.
УдалитьЯ уже дал ответ на это вопрос, вы опять-таки пропустили его мимо длинных ушей.
Великих людей надо аккуратно цитировать, а не приписывать им свою бредятину
УдалитьНу и как же по твоему умник следует перевести эту фразу:
probability that it will happen again the next time is equal (N+1)/(N+2)
Гигант мысли, где здесь МОЯ и где здесь уверенность? Настоящий ученый обязан сомневаться в своих словах, но не в этом дело. Вижу только слово вероятность и утверждение с претензией на абсолютную истину. Идет попытка экспроприации общеупотребительного объективного термина вероятность и использование его в сугубо субъективном смысле.
Я уже дал ответ на это вопрос, вы
Вопрос касался результатов, а не подходов, слепошарый.
Злой анонимный Х.
Думаешь меня переплюнуть в обзывательствах, как и в стишках давеча? Гы. Предлагаю не скатываться, тебе ж лучше будет.
И засунь се в зад свои софизмы, отвечай по делу. Тебе уже указывали на такой косяк характера.
Вот болван цитата тебя любимого:
УдалитьОно работает одинаково хорошо даже при n=0, т.е. решение Лапласа дает логически абсолютно безупречный результат для исходных вероятностей (т.е. до проведения единого эксперимента): р=1/2 как для решки так и для орла.
Надо тыкать носом на место или сам найдешь?
Т.е сейчас будешь доказывать, что это не одно и то же со следующим?
Конкретный пример с тем же Лапласом. Он говорит "Вероятность того что завтра солнце взойдет = 1\2" - вполне себе бредятина по нормальным меркам.
Ну конечно, а что еще остается.
Злой анонимный Х
Этот комментарий был удален администратором блога.
УдалитьЭтот комментарий был удален администратором блога.
УдалитьКоллеги,
Удалитьвашу туалетную переписку неприятно читать (подозреваю, не только мне), поэтому обменивайтесь ею в индивидуальном порядке. Напротив, все ваши математические возражения друг другу и другим читателям блога весьма интересны и полезны.
Поэтому я буду очень рад продолжению беседы с вашим участием в следующих заметках. Борьба за истину не зря называется борьбой. Но переход на личности никогда не будет в ней аргументом. Так что, жду настоящих аргументов в грядущих спорах.
Злой Х,
УдалитьЯ думаю, что Илья здесь прав. Если хотите продолжать обмен мнениями на поэтическом или любом другом языке, с которым вы чувствуете себя удобнее, дайте пожалуйста знать, и я дам вам свой адрес.
По поводу исходной задачи. Вполне очевидно, и Илья это показал, что при игре в эту игру мы каждый раз увеличиваем свой капитал в 1.8 - 0.8x раз, где х - количество капитала, которое сохраняем. Никакого парадокса здесь нет. Если мы хотим выиграть максимум за n игр - нужно играть на все. Математически здесь все строго, никакого парадокса нет, и нечего и выдумывать.
ОтветитьУдалитьТеперь о том, почему "житейская интуиция" противится такому ответу. Потому что наша человеческая интуиция очень плохо воспринимает большие цифры. В частности, если 100 раз сыграем на все то мы выйграем 1,27*10^32 денег, хотя и с вероятностью 0.0027%. Но человеческой интуиции эти 10^32 ни о чем не говорят, т.к. реально таких денег не бывает, она никак не отличает их, например, от 10^25 или 10^15. Все это воспринимается как "дохрена денег". Т.е. представим, что мы играем 99-й раз подряд на все. У нас "дохрена денег", если выйграем денег у нас станет "1.8 * дохрена денег = дохрена денег", если проиграем - "ноль денег". Т.е. с точки зрения интуиции мы рискуем всем, не приобретая ничего взамен ( т.к. и тех денег хватило бы на все, на что только можно ). Естественно, она противится подобному риску.
Т.е. если бы я играл в подобную игру, я играл бы на все, пока не набрал сумму, которую мне вполне достаточно на всю жизнь, после чего уже не рисковал бы, т.к. игра стала бы рискованной.
valergrad
> Т.е. если бы я играл в подобную игру, я играл бы на все, пока не набрал сумму, которую мне вполне достаточно на всю жизнь, после чего уже не рисковал бы, т.к. игра стала бы рискованной.
Удалить- Вы, я вижу, бескорыстно любите деньги. Скажите, какая сумма вам нравится? (c) Золотой теленок.
А что если вам не повезет с первой же ставкой? Игра не становится рискованной - она рискованная с самого начала и до конца (вашего конца). Незабывайте: по правилам игры нельзя после неудачи занимать деньги у тещи. И нельзя выходить из игры когда "набрал сумму, которую мне вполне достаточно на всю жизнь". Надо играть по правилам, дорогой valergrad.
Тише едешь - дальше будешь,
Много хочешь - мало получишь.
Wanderer дал бы вам полезный совет проделать небольшой эксельный эксперимент и самому убедиться в мудрости народных пословиц.
И нельзя выходить из игры когда "набрал сумму, которую мне вполне достаточно на всю жизнь"" - вот это не понял. Когда-то же выйти надо. Бесконечные игры рассматривать нет смысла. Нужно уточнить когда будет конец игры.
УдалитьЕсли конец будет по прошествии k раундов - то оптимальная стратегия, как уже сказали и доказали - играть на все. Как бы интуиция не противилась этому. Если ограничения такого нет, а, например, у банка есть определенный лимит денег, и тебе нужно максимально надежно его весь забрать - это другое. Вполне ожидаемо, что играть на все здесь окажется плохой стратегией. Нужно уточнить условие. Кстати, в такой формулировке задача довольно интересна, надо подумать.
valergrad
" Wanderer дал бы вам полезный совет проделать небольшой эксельный эксперимент и самому убедиться в мудрости народных пословиц."
УдалитьА давайте проверим! Я правда в экселе не силен, мне С++ ближе. Но если кто сделает экселевский файл - обещаю, изучу. Могу домой придти и написать программку на С. Итак, вы утверждаете что при каком-то количестве раундов N, при какой-то доле оставляемых у себя денег X мы сможем заработать в среднем больше денег, чем если будем играть каждый раз на все? Я вас правильно понял? Тогда скажите, пожалуйста, при каком количестве раундов и какой доле денег такое наблюдается, а я поставлю эксперимент, и сравним.
valergrad
Складывается впечатление, что вы оба понимаете разницу между "средним выигрышем" и "очень вероятным выигрышем". Если так, то к чему эта перепалка?
УдалитьВ самом деле, после фразы "если бы я играл в подобную игру, я играл бы на все, пока не набрал сумму, которую мне вполне достаточно на всю жизнь" может остаться ощущение, что её автор уверен, что он заведомо наберёт эту сумму. А между тем, с вероятностью 10% этот замечательный план может разрушиться на первом же шаге, а с вероятностью 19% на одном из первых двух шагов. Согласитесь, это уже похоже на шансы в "русской рулетке".
В то же время, если игрок будет оставлять разумную часть суммы "на случай провала", то пусть позже, но с радикально большей вероятностью он достигнет цели ("суммы, которую вполне достаточно на всю жизнь"). Разве не так?
Илья, все я понимаю. Просто здесь условие задачи неопределено, вот и спорят люди. Неизвестно сколько игр будет сыграно, неизвестно в какой момент можно-нельзя выходить, неизвестно к чему стремится игрок - к максимальному выигрышу или к наиболее надежному выигрышу и т.д. В итоге каждый читатель додумывает условия сам для себя, а из-за того что разные люди додумывают по-разному возникает подобное противоречие. Незачет вам, Илья, за формулировку задачи. А так-то многие здесь правы, только решают разные задачи. Дабы закрыть тему, предлагаю решение для следующих 6-и возможных задач.
УдалитьИгра 1. Условие: Играют строго N игр. Игрок стремится к максимальному среднему выигрышу.
Решение : оптимальная стратегия здесь играть на все деньги.
Игра 2. Условие: Играют строго N игр. У игрока в голове есть сумма X, которую ему хватит на всю жизнь. Нужно максимизировать вероятность того, что в результате игры он получит эту сумму. В качестве доп. показателя - максимальный средний выигрыш.
Решение: оптимальная доля зависит от N и Х. Конкретную формулу каждый из вас может вывести самостоятельно, могу привести расчеты дополнительно для тех, кому интересно.
Игра 2.5. Условие: Играют строго N игр. Игрок хочет максимизировать вероятность того, что он окажется в выигрыше. В качестве доп. показателя - максимальный средний выигрыш.
Решение: как игра 2, только X нужно принять равным единице.
Игра 3. Условие: Играют строго N игр. Игрок хочет максимизировать вероятность того, что он не уйдет ни с чем. В качестве доп. показателя - максимальный средний выигрыш.
Решение: Вероятность не уйти ни с чем равна 1, если не играть олл-ин. Максимальный средний выигрыш соответсвенно будет при ставке стремящейся к олл-ину. Т.е. чем больше мы поставим, тем больше в среднем выиграем, но нелья ставить на все. Нужно оставлять e > 0, чем меньше e, тем лучше.
Игра 4. Условие: Играют пока игрок желает, выйти можно в любой момент. Игрок стремится к максимальному среднему выигрышу.
Решение: максимальный средний выигрыш здесь равен бесконечности т.е. чем дольше играет игрок тем больше будет выигрывать. Это НЕ ЗАВИСИТ от того, какую ставку делает игрок ( лишь бы она была ненулевой). В том числе олл-иновая ставка также сгодится.
Игра 5. Условие: Играют, пока игрок желает, выйти можно в любой момент. У игрока в голове есть сумма X, которую ему хватит на всю жизнь. Нужно максимизировать вероятность того, что в результате игры он получит эту сумму. В качестве доп. показателя - стремимся получить нужную сумму быстрее.
Решение: ЛЮБАЯ ненулевая и не олл-иновая ставка дает игроку возможность выйграть нужную сумму с вероятностью строго равной 1. Скорость выигрыша тем выше, чем больше мы ставим. Т.е. здесь ставка должна быть такая же как в игре 3.
Игра 6. Условие: Играют, пока игрок желает, выйти можно в любой момент. Игрок хочет максимизировать вероятность того, что он не уйдет ни с чем. В качестве доп. показателя - максимальный средний выигрыш.
Решение: Т.к. в игре 4 вероятность равна 1, то этот случай совпадает с игрой 4.
Можно придумать еще кучу других игр, и у них у всех могут быть разные решения. Но нетривиальным решение оказалось пка только у случая 2.
valergrad
valergrad,
Удалитьспасибо за отличный список возможных игр и за решения!
В заметке не зря упомянута задача Бертрана, не зря сказано, что до решения надо определиться, что значит "оптимальная игра". Вы правильно говорите, что для чистоты формулировки задачу надо определять предельно чётко. Но всегда ли нам нужна эта чистота? Мы же не на вступительном экзамене здесь!
Куда полезнее подумать, какие есть способы определить эту оптимальность, какие из этих способов интересны, для каких можно придумать красивое решение, какие более естественны и так далее. Вы и многие читатели проделали немалую часть этой работы, что, я думаю, хорошо. А если бы я здесь сформулировал задачу предельно аккуратно, то думать бы уже не пришлось, так как, зная вопрос, уже достаточно легко найти ответ.
valergrad безусловно прав когда говорит, что
Удалить>Можно придумать еще кучу других игр, и у них у всех могут быть разные решения.
Но valegrad не понял суть поставленной проблемы, на что Илья обратил его внимание со свойственной ему (в выгодном отличии от вашего покорного слуги ) деликатностью:
>В заметке не зря упомянута задача Бертрана, не зря сказано, что до решения надо определиться, что значит "оптимальная игра".
Задача заключается не в том, чтобы придумать как можно больше конкретных вариантов этой игры, каждый из которых предельно точно сформулирован с математической точки зрения. Задача скорее заключается в том, чтобы наиболее разумным образом “доформулировать” эту, нарочно нечетко сформулированную проблему. Ведь жизнь практически никогда не ставит перед нами проблему в виде математического упражнения из задачника Давидовича. Простите за каламбур, но разумная формализация задачи и есть основная задача в этой задаче. Причем эта формализация, кроме всего прочего, должна коснуться и вопроса о “граничных” условиях, т. е. чему равняется N? и каковы правила, регламентирующие конец игры?
Давайте посмотрим на эту проблему как на реальную жизненную проблему. В результате кропотливого и внимательного изучения поведения фондовой биржи, нам наконец удалось выработать идею, которая дает нам явное преимущество перед другими игроками на бирже. Что делать дальше? Естественно мы не хотим делиться ни с кем этим важным открытием, потому что мы сами с усами и хотим сделать деньги на нем. Ежу понятно: как только наш секрет перестанет быть секретом, он перестанет работать. Хотим мы того или нет, наш замечательный метод рано или поздно перестанет работать, причем, чем выгоднее секрет, тем труднее скрывать его более или менее продолжительное время. Кроме того, как хорошо известно любому биржевому спекулянту, рынок имеет отвратительную привычку неожиданно и без всякого предупреждения менять режим и характер своего поведения, тем самым выбрасывая наш гениальный метод коту под хвост.
Следовательно, разумная формализация проблемы требует признания, что число раундов N нам заранее неизвестно. Однако мы знаем, что N фиксировано и конечно - мы просто не знаем чему оно равно. Разумно также считать, что мы четко почувствуем, когда наш метод делания денег перестает работать - это когда петух начнет методично клевать нам в мягкое место. Теперь о “граничном” условии выхода из игры. Нет закона, требующего чтобы мы продолжали пользоваться своим методом пока петух не клюнет - мы должны иметь право, и имеем по всем правилам игры на фондовой бирже, выйти из игры в любой момент, и заняться поисками нового метода. Если наш метод поработал на славу, следуя мудрой поголовке, простите, поговорке - от добра добра не ищут - вполне имеет смысл выйти из игры заблаговременно, т.е. до того, как петух неожиданно и больно клюнет.
Вот как-то таким образом я формализовал бы “граничные” условия в этой проблеме.
ОтветитьУдалить(s+1)/(n+2) - строгий математический вывод; s/n - эмпирика
(s+1)/(n+2) - точная формула; s/n - приближение (а не наоборот)
(s+1)/(n+2) - отсутствие логического противоречия; s/n - ad-hoc
Вы Артур забыли в конце добавить Аминь. Иначе мысль видится незавершенной. А так хоть будет понятно что Вы хотели этим сказать.
Злой анонимный Х.
Аминь
УдалитьВ связи с исходной задачей у меня возник следующий вопрос, ответа на который я пока не знаю.
ОтветитьУдалитьДопустим, есть два азартных игрока А и В.
Оба они регулярно приходят в некое условное казино, и играют в игру, где вероятность выигрыша за один тур равна Р=0,9, при выигрыше ставка удваивается, при проигрыше ставка теряется - в полном соответствии с условиями исходной задачи.
Каждый раз каждый из игроков приходит в казино с одинаковой суммой денег V.
В чём разница между игроками?
Игрок А играет ТРИ дня в неделю, делая в каждый из дней ровно по ДВЕ ставки,
причём размер каждой его ставки составляет В=(1-Х)*W(N), где W(N) - сумма денег у игрока после N - го тура игры, W(0)=V, и 0<Х<1.
Игрок В играет два дня в неделю, но делает в каждый из дней ровно по три ставки.
Размер каждой из трёх его ставок составляет В=(1-Y)*W(N), где W(N) - сумма денег у игрока после N - го тура игры, W(0)=V, и 0<Y<1.
Вопрос заключается в том, при каком X первый игрок получит максимальный суммарный выигрыш в течении достаточно продолжительного промежутка времени, и при каком Y второй игрок получит максимальный суммарный выигрыш в течение того же промежутка времени, и чей суммарный выигрыш окажется больше???
Вы предложили интересную модификацию игры, спасибо!
УдалитьЛучше всего ставить обоим всю сумму, так как игр достаточное количество, следовательно максимализируем мат. ожидание.
ОтветитьУдалитьLuxo Apr 17, 2012 07:33 AM
ОтветитьУдалитьЛучше всего ставить обоим всю сумму, так как игр достаточное количество, следовательно максимализируем мат. ожидание.
_______________________________
Совершенно верно!
Действительно, нужно ставить всю сумму.
И это правильный ответ на основной вопрос, который Илья Весенний задал в исходном сообщении:"Если бытовая интуиция говорит нам «сохрани хоть сколько-то, чтобы иметь возможность возобновить выгодную игру, если вдруг не повезёт», а сухая математическая наука говорит «выгоднее всего играть на всю сумму», то кому верить?"
Верить разумеется нужно в себя, в свои силы, а к советам "сухой математической науки" нужно прислушиваться.
Действительно, если играть в эту гипотетическую игру ежедневно, но ограничив себя строго двумя ставками в день (N=2), удваивая ставку в случае победы в первом раунде, то,
в среднем лишь дважды за десять дней не сыграет либо первая ставка, либо вторая, и мы проиграем всю сумму денег (V), с которой мы начали игру.
Зато другие восемь дней две ставки подряд сыграют, и мы дважды удвоим свой стартовый капитал.
Всего за десять дней мы, вложив в игру (10*V) денег, будем иметь на руках выигрыш в размере 8*(4*V)+2*(0*V)=32*V.
Для сравнения, выбрав х=0.2 при N=2, и ставя первый раз 0,8*V, а второй раз, в зависимости от результата первой ставки, либо 0,8*(1,8*V), либо 0.8*(0,2*V),получим восемь дней по 3,24*V, и ещё два дня по (0,36*V).
То есть всего, за десять дней, вложив (10*V) получим выигрыш
8*(3,24)*V+2*(0,36*V)=26,64*V, что меньше, чем 32*V...
Если же в день делать максимум шесть ставок, удваивая ставку, то, при вероятности выигрыша р=0,9, "чёрный лебедь" будет прилетать примерно через день, зато примерно каждый второй день сыграют все шесть ставок подряд, что принесёт нам выигрыш в размере (2^6)*V=64*V.
Если при той же вероятности р=0,9 выбрать N=10, то примерно два из трёх дней будут с нулевым выигрышем, зато каждый третий день будем получать (1024*V).
Никакая другая стратегия х>0 не будет такой эффективной, как стратегия х=0.
> Никакая другая стратегия х>0 не будет такой эффективной, как стратегия х=0.
УдалитьНикакая другая стратегия х>0 не будет такой катастрофической, как стратегия х=0.
Arthur Baraov Apr 18, 2012 11:08 AM
ОтветитьУдалить> Никакая другая стратегия х>0 не будет такой эффективной, как стратегия х=0.
Никакая другая стратегия х>0 не будет такой катастрофической, как стратегия х=0.
____________________________
Что поделаешь, мы живём в вероятностном мире, где катастрофичность есть оборотная сторона эффективности!
> Что поделаешь, мы живём в вероятностном мире, где катастрофичность есть оборотная сторона эффективности!
УдалитьСглаживать надо. Небольшой жертвой эффективности можно полностью устранить катастрофу. Это называется risk management. Как советовал мудрый Черномырдин: Не кладите оба свои яйца в одну корзину. Пользуйтесь хотя бы услугами Госстраха!
Несколько подробнее остановлюсь на том, почему стратегия х=0.2 для предложенных Ильёй условий более оптимальна, нежели самая эффективная стратегия х=0.
ОтветитьУдалитьНо сначала необходимо уточнить, что мы понимаем под "выигрышем" для данной игры.
Я предлагаю считать "выигрышем" такой результат игры , когда капитал игрока после N туров V(N) больше, чем его капитал до начала игры V(0):
V(N) > V(0), или
V(N) / V(0) > 1.
Соответственно, "проигрышем" будет любой результат, для которого:
V(N) < V(0), или
V(N) / V(0) < 1.
Замечу попутно, что при N=1, если мы не планировали продолжать игру далее,
любая стратегия будет выигрышной с одинаковой вероятностью р=0.9, и проигрышной, можно даже сказать "катастрофической", с вероятностью q=0.1.
Я умышленно не делаю различия между х=0 и х>0 переходя к предложенной здесь
Arthur Baraov функции выигрыша θ(K-M), которая, кстати, от "х" в данном конкретном случае не зависит.
Аналогично и для N=2 только два выигрыша подряд приведут к выигрышу всей игры , причём вероятность такого события составит Р=0.81.
Остальные 19% игр ни при какой стратегии не дадут нам V(2) > V(0).
Теперь посмотрим, что будет при N=3.
А при N=3 картина качественно меняется.
Если мы выберем х=0.2, то для победы в этой серии нам необходимо выиграть все три игры.
Вероятность трёх побед будет достаточно велика Р(3-0)=0,729 и V(3)=V(0)*5,832...
Можем ли мы рассчитывать на победу в серии при двух удачных ставках и одной неудачной?
Нет, в этом случае мы получим V(2-1)=0.648*V(0).
Этот катастрофический результат, кстати, свидетельствует о том, что при х=0.2 и N=3 функция, предложенная Arthur Baraov принимает значение θ(2-1)=0.
Можно ли как-то воздействовать на сложившуюся ситуацию?
Да, можно!
Несложный расчёт показывает, что выбрав, например х=0.4, получаем, что
V(2-1) = V(0) * 1.024 > V(0).
Теперь уже θ(2-1)=1, и мы выигрываем в серии с вероятностью Р(3)=Р(3-0)+Р(2-1)=0,729 +0,243=0,972
то-есть почти наверняка.
Правда, за удовольствия надо платить.
Сколько?
Считаем:
V(3-0) теперь не 5,832*V(0), как это было при х=0.2,
а всего лишь V(3-0)= 4.096*V(0).
или 70% от случая х=0.2.
Недостающие 30% есть ни что иное, как своеобразная "страховка", "уплаченная" нами за увеличение вероятности выигрыша c 72.9% до 97.2%.
Вот такая нехитрая арифметика хорошо иллюстрирует особенности рассматриваемой
игры.
Остаётся ещё заметить, что величина выигрыша V(2-1) достигает максимума V(2-1)=32/27=1.185 при х=2/3.
Этот результат можно получить, приравняв к нулю первую производную от выражения
(2-х)^(2/3)*x^1/3.
Можно, конечно, выбрать эту стратегию, но в 72,9% процентах случаев (3-0) мы тогда потеряем намного больше, чем выиграем по максимуму в 24,3% случаев приводящих к исходу игры (2-1).
Я бы предпочёл стратегию, которая делает V(2-1) лишь чуть-чуть больше V(0).
Такая стратегия позволяет оптимизировать получить максимальный выигрыш допускаемый при максимальной вероятности его получения.
Для этого нужно решить уравнение:
(2-х)^(2/3)*x^(1/3)=1.
Корень его, лежащий в интервале (0;1), а именно:
х=0.382,
и даст нам оптимальную стратегию для N=3.
При этом V(2-1)=V(0)*1.00004.
И эти 24,3 процента от всех возможных случаев практически не принесут нам никакой прибыли, но зато в 72,9% случаев с исходом (3-0)
получим V(3-0)= V(0)*4.2358...
Вот как-то так я вижу решение этой задачи.
Спасибо за отличный практический разбор тонких моментов!
УдалитьДумаю, он многим поможет понять, чем отличаются случаи длинных серии игр и серии из одной-двух-трёх игр.
Илья Весенний Apr 19, 2012 09:16 PM
ОтветитьУдалитьДумаю, он многим поможет понять, чем отличаются случаи длинных серии игр и серии из одной-двух-трёх игр.
------------------------
Думаю, что они не сильно отличаются...
Я вчера планировал рассказать и о длинных сериях, но утомился от долгопечатания... :)
А сегодня уже нет того вдохновения.
Поэтому изложу накоротке.
Если у нас имеется некоторая вероятность выиграть ставку в каждом из отдельных розыгрышей "р",которую можно представить некоторой рациональной дробью p=M/(M+N), где "M" и "N" натуральные числа, то характерной особенностью биномиального распределения, которому подчиняется наш случайный процесс будет то факт, что после каждых (M+N) туров наибольшую из всех вероятностей исходов серии игр будет иметь вероятность выиграть "M" игр и проиграть "N" игр P(M-N). Например, для p=0.7
положим M=7, N=3 и (M+N)=10.
Тогда расчёт вероятности P(7-3) того что в произвольной серии из 10 туров игры мы выиграем ровно 7 раз и ровно три раза проиграем в произвольной последовательности дает результат
P(7-3)=0.2668...
Для сравнения:
Р(8-2)=0.2334...
Р(6-4)=0.2001...,
что несколько меньше.
А теперь прикинем, какова вероятность не проиграть более трёх игр в произвольной серии из 10 игр.
Она равна Р(10-0)+Р(9-1)+Р(8-2)+Р(7-3)=0.65...
то есть почти две трети.
Но можно попробовать увеличить эту вероятность подбором стратегии "х" которая сделает положительным результат серии при четырёх поражениях из десяти.
Если это удастся сделать, то вероятность победной серии возрастёт с 0.65 до 0.85 и превысит, таким образом, даже вероятность Р(1-0)=0.7 для серии, состоящей из одной игры.
Несложный расчёт показывает, что условие V(6-4)/V(0)>1 будет выполняться для стратегий
0,61...< x <1.
Мы всегда можем найти стратегию для достижения максимума указанного соотношения V(M-N)/V(0)
с помощью формулы:
х=2*N/(M+N).
Подставив значения найдём:
х=2*4/(6+4)=0.8
Таким образом, видим, что, рискуя в каждом туре лишь 20 процентами своего капитала, мы даже в случае четырёх поражений в десяти турах сохраняем профицит на уровне V(6-4)=V(0)*1.223...,
то есть получаем прибыль от 22,3 процентов
в худшем случае четырёх проигрышей, до более чем шестикратного увеличения исходного капитала в самом благоприятном случае из десяти побед подряд.
и всё это с общей вероятностью 0.85...
Все читатели проигнорировали, или не заметили, самый первый попутный вопрос Ильи в этой заметке, а именно:
ОтветитьУдалить> Верно ли, что математическое ожидание выигрыша будет максимальным при нулевом резервном капитале для любого количества игр?
Чтобы ответить на этот вопрос, давайте вычислим мат ожидание выигрыша для более общего случая, когда доля резервного капитала может произвольным образом меняться от раунда к раунду.
Обозначим абсолютное значение ставки k-го раунда через S(k). Введем случайную переменную E(k): E(k)=1, если мы выиграли k-ый раунд, и E(k)=-1, если мы проиграли k-ый раунд. Тогда наш финальный капитал после N раундов будет равен:
W=V+E(1)S(1)+E(2)S(2)+ ... +E(N)S(N).
Применяя операцию осреднения <> к этому выражению, мы получаем:
<W>=<V+E(1)S(1)+E(2)S(2)+E(3)S(3)+ ... +E(N)S(N)>=
V+<E(1)>S(1)+<E(2)>S(2)+ ... +<E(N)>S(N)=
V+(p-q)S(1)+(p-q)S(2)+ ... +(p-q)S(N).
Поскольку (p-q)>0, максимум мат ожидания конечного капитала достигается, когда на каждом раунде мы рискуем всем своим капиталом, не оставляя ни единой копейки в резерве.
Если кто-то из вас по счастливой случайности окажется на следующей неделе в Калифорнии, я настоятельно рекомендую счастливцу посетить семинар, который проведет 3 мая Dr. Edward Thorp для студентов UCI. Этот крепкий старик, который имел честь работать тесно с самим отцом теории информации и изобретателем понятия энтропии Claude Shannon над созданием первого в мире карманного компьютера со специальной целью побить "абсолютно случайную" рулетку в игорных домах Лас-Вегаса, сможет рассказать сегодня о критерии Келли больше и лучше, чем кто бы то ни было еще во всем мире.
ОтветитьУдалитьЯ также рекомендую счасливчику, кто попадет на семинар Dr. Thorp, полюбопытсвовать, что думает этот пожилой джентльмен, кто на практике побил рулетку, карточную игру blackjack и рынок акций, пользуясь исключительно научными методами, в частности критерием Келли, о существовании абсолютно случайных процессов.
это задача из разряда money management/risk management.
ОтветитьУдалитьНа рынке нельзя управлять своей прибылью (ибо она случайна), только размером своего риска. Исходят из этого стратегии money management подбираются чтобы на большом n получить минимальные (или, скажем, приемлемые) две величины - максимальная средняя (в результате многократного моделирования) просадка , и вероятность обнуления счёта.
Если, скажем, вероятность разорения 0, но вероятная проскдка 90%, то такая стратения тоже рискованна - может быть вам нужно выйходить из игры, вывести денег, а на счету почти ничего нет :-)
Насколько я помню, эта задача обычно решается многократным прогоном на случайных числах, с разными параметрами. потом по графикам или табличкам приемлемые параметры выбираются.
Еще момент - если брать Ваш вариант постановки задачи, с тем что рискуется всегда некая сумма, пропорциональаня счёту, то до обнуления можно идти очень долго :-) Но на практике минимальная цена лота/контракта заставит остановиться раньше.
Shebnik совершенно правильно отмечает, что:
ОтветитьУдалить> это задача из разряда money management/risk management.
На рынке нельзя управлять своей прибылью (ибо она случайна), только размером своего риска.
Иначе говоря, чтобы стабильно выигривать на рынке в среднем, не подвергая себя чрезмерному риску внезапной и катастрофической потери всего капитала, нужно иметь по крайней мере две составляющие:
(1) Прежде всего нужно знать куда именно вкладывать: мат ожидание выигрыша от ваших вкладов должно обязательно быть выше нуля. Другими словами, вы должны иметь такой метод подборки акций куда вкладывать деньги, который дает преимущество (edge), т.е. вы должны сначала придумать такой метод. В этой задаче просто предполагается, что такой метод у вас уже есть: этот метод гарантирует удваивание ставки в 90% случаев, и потерю ставки в оставшихся 10% случаев. Как легко проверить, мат ожидание выигрыша с этим методом значительно выше нуля: (2К*0.9 + 0*0.1) - К = 0.8К, т.е. у вас уже есть очень хороший метод выбора акций куда вкладывать ваши деньги. Если у вас нет такого метода с положительным мат ожиданием, ни Келли, и никакой другой метод управления риском вам не поможет.
(2) Вышеприведенное условие является необходимым, но недостаточным для того, чтобы стабильно выигривать на рынке в среднем. Нужно еще уметь управлять риском, чтобы избежать катастрофическую потери всего капитала. Другими словами, нужно знать не только куда вкладывать - очень важно также знать СКОЛЬКО вкладывать. Критерий Келли и дает ответ на этот важный вопрос о СКОЛЬКО же надо вкладывать, чтобы оптимальным образом снизить риск, не жертвуя при этом очень сильно проспектами вашего общего выигрыша в результате повторных вложений.
Вот как Edward O. Thorp сформулировал вышеприведенные условия для успеха на рынке, или при игре в азартные игры:
(1) The fundamental problem in gambling is to find positive expectation betting opportunities. The analogous problem in investing is to find investments with excess risk-adjusted expected rates of return.
(2) Once these favorable opportunities have been identified, the gambler or investor must decide how much of his capital to bet. This is the problem which we consider here. It has been of interest at least since the eighteenth century discussion of the St. Petersburg Paradox (Feller, 1966) by Daniel Bernoulli.
На международной конференции MaxEnt 2011, состоявшейся в Канаде в прошлом году, был доклад как раз на эту тему. Автор этого доклада утверждал, что метод Келли это метод для выигрыша на рынке, и что сам Келли сделал большие деньги на своем методе, на что я возразил, что, во-первых, Келли сам не сделал большие деньги на своем методе, и во-вторых, Келли это не метод, гарантирующий выигрыш на рынке - это всего лишь метод, гарантирующий избежание быстрой и катастрофической потери всего.
Вы можете послушать этот доклад, и мое возражение докладчику в конце доклада (на 28 минуте), щелкнув здесь.
Если link не работает, то попробуйте это: http://www.youtube.com/watch?v=qpEHPLOFg5s