4 июн. 2010 г.

Хитрые конверты

Полгода назад мы разбирались с парадоксом двух конвертов. Задачка эта хоть и является достаточно простой, но важность её очень высока. Дело в том, что интуитивные представления уж очень сильно сопротивляются верным рассуждениям. По комментариям к разбору было хорошо видно, как мозг желающих разобраться в парадоксе из последних сил цеплялся за ложные представления.

Коротко напомню суть, чтобы перейти к интересной модификации этой игры:

Ведущий предлагает игроку два конверта, в одном из которых находится вдвое большая сумма, чем в другом. Допустим, игрок выбрал конверт, в котором ровно 10 денег. Пересчитав их, он понимает, что во втором конверте с равными вероятностями может быть как 5, так и 20. А раз так, то замена конверта даст ему средний выигрыш (5+20)/2 = 12.5, что больше 10. Другими словами, поменять случайный конверт на другой должно быть выгодно. Но разве тактика «выбери любой конверт, а потом поменяй его на второй» может быть выгоднее тактики «выбери любой конверт»? (это уже вопрошает здравый смысл)

В прошлый раз мы убедились, что проблема в этой постановке задачи заключена в следующей фразе: «во втором конверте с равными вероятностями может быть как 5, так и 20». Всё дело было в том, что в условии задачи ничего не сказано о принципе формирования конвертов, поэтому мы не можем рассчитывать на равновероятность обоих исходов (мы привели примеры разных распределений, в которых данные вероятность существенно отличаются от 50%). В комментариях к заметке с разбором мы этот вопрос со всех сторон рассмотрели.

Теперь же я предлагаю новую игру, в которой все распределения хорошо известны, а суммы в конвертах будут отличаться не в 2 раза, а в 10.

Итак, у казино есть случайная величина x на отрезке от 0 до 1 (распределение равномерное). И именно по этой величине компьютер формирует конверты:
- если 1/2 <= x, то в конверты помещают суммы 1 и 10,
- если 1/4 <= x < 1/2, то в конверты помещают суммы 10 и 100,
- если 1/8 <= x < 1/4, то в конверты помещают суммы 100 и 1000,
...
- если 2^(-n-1) <= x < 2^(-n), то в конверты помещают суммы 10^(n-1) и 10^n,
...

Как видите, вероятность события, описанного в каждой строке, в два раза выше, чем вероятность события, описанного в следующей строке. И сумма всех этих вероятностей как раз равна единице, поэтому всё хорошо - мы работаем с вполне корректным распределением сумм по конвертам. Теперь представим себе игрока, который знает это правило формирования конвертов.

Пусть игрок вытянул случайный конверт из предложенных двух, а в нём ровно 1. Что это означает? У нас есть всего один тип конвертов, в одном из которых лежит единица - это (1, 10). Так игрок понимает, что во втором конверте заведомо 10, верно?

Теперь пусть игрок вытянул случайный конверт, а в нём ровно 10. Тут есть два варианта: во втором конверте может быть 1 или 100. Важно, что пара (1, 10) в два раза более вероятна, чем пара (10, 100). Другими словами, во втором конверте с вероятностью 2/3 находится 1, а с вероятностью 1/3 - 100 денег. Давайте посчитаем математическое ожидание выигрыша от смены конверта: 1/3 * 100 + 2/3 * 1 = 34. Другими словами, если игрок вытянул 10 денег, то замена конверта принесёт ему средний выигрыш 34, что является очень выгодной сделкой, так?

Аналогичное рассуждение легко провести для всех остальных чисел. Пусть игрок вытянул 10^n. Тогда во втором конверте может быть 10^(n-1) или 10^(n+1). Первое число меньше и в два раза вероятнее. Но второе гораздо больше. Считаем математическое ожидание выигрыша от смены конверта: 1/3 * 10^(n+1) + 2/3 * 10^(n-1) = 34 * 10^(n-1). А это опять в 3.4 раза больше, чем сумма в только что открытом конверте!

Выходит, что выигрышная тактика формулируется очень просто: «выбери любой конверт, а потом поменяй его на второй». Но где-то мы это уже слышали :)

Как же так? Где нас подводит здравый смысл, а где неправильное использование математических инструментов? :)

Хорошего дня!

21 комментарий:

  1. Анонимный04.06.2010, 18:45

    Здравый смысл говорит, что всё дело в бесконечном матожидании денег в обоих конвертах.

    ОтветитьУдалить
  2. Согласен с Анонимом выше.

    Приведенное равномерное распределение хоть и задано на конечном интервале, имеет бесконечное матожидание.

    Поэтому, мне кажется, что если честно считать матожидание от смены конверта, то оно получится бесконечным. А раз так, то менять конверт не имеет смысла, и парадокс пропадает.

    Кстати, выгода от смены тогда равняется бесконечность минус бесконечность, т.е. вообще не определена.

    ОтветитьУдалить
  3. В статье рассматривается матожидание при условии, что в одном из конвертов 10 денег и мы открыли именно его. А надо рассматривать матожидание при условии, что конвертах 10 и 100 денег, и мы открыли любой из них. Тогда обе стратегии дают одинаковый результат.

    ОтветитьУдалить
  4. Даже если матожидание бесконечное, интересно узнать, чему равняется lim(M1/M2) - 3.4 или 1.0?

    Вариант подсчета, указанный в статье, дает 3.4. Но, видимо, он неправильный. Когда мы уже открыли конверт и увидели 10 денег, на самом деле мы не учитываем 2 дополнительных варианта - увидели 1 денег и 100 денег. Первый вариант рассматривается на предыдущем шаге индукции, второй - только на следующем. Но именно второй вариант (100 денег) уравнивает стратегии. Следовательно, индукция неправильная.

    ОтветитьУдалить
  5. Анонимный04.06.2010, 20:05

    Илья, изъящная вариация парадокса, которая напомнила мне Санкт-Петербургский парадокс, над которым до сих пор люди ломают головы.

    Вы конечно догадаетесь, что разрешение вашего варианта легко покрывается разгадкой, которую я окрестил “замести отрицательную часть распределения математического ожидания выигрыша под ковер бесконечности”.

    Однако воздержусь от изложения подробностей, чтобы, сообщив окончательный счет матча, не испортить наслаждение зрителям, которые смотрят интересный футбольный матч в записи.

    Кстати, вы не собираетесь предложить своим читателям поломать головы над Санкт-Петербургским парадоксом в одном из своих будущих заметок?

    ОтветитьУдалить
  6. Анонимный04.06.2010, 20:09

    Простите, забыл подписаться
    Arthur

    ОтветитьУдалить
  7. ИМХО, парадокс Монти-Хилла даёт более интересный расклад, нежели подобная задача.

    ОтветитьУдалить
  8. Анонимный04.06.2010, 22:03

    > неправильное использование математических инструментов
    В точку. Сразу вспомнился препод по вероятностным моделям в экономике, начавший курс с петербургского парадокса - очень яркий пример, да.

    ОтветитьУдалить
  9. Arthur, да, Санкт-Петербургский парадокс очень близок к этой задачке. Я планировал сформулировать его в одной из следующих заметок, потому что он очень уж классический :)

    Евгений Смирнов, парадокс Монти-Холла мы рассматривали год назад. А скоро будем разбирать интересную его вариацию.

    ОтветитьУдалить
  10. [..]Как же так? Где нас подводит здравый смысл, а где неправильное использование математических инструментов? :)[..]

    Разгадка, имхо, в том, что не учтено _влияние ведущего_ на эксперимент! Для простоты, пусть испытуемый оперирует лишб тремя понятиями - большая сумма (Б), средняя (С) и маленькая (М). Тогда, чтобы эксперимент прошел корректно, без внешних воздействий, испытуемый должен выбирать из трех пар конвертов [Б,С] [С,М] [С,М], то есть всего из шести - 1*Б, 3*С, 2*М или вероятностей 1/6 (Б), 1/2 (С) и 1/3 (М).

    Предлагая испытуемому ДВА конверта, ведущий тем самым действительно не меняет вероятности выпадения С, НО одновременно с этим он так же увеличивает вероятность Б с 1/6 до 1/2 и уменьшает М до нуля, либо увеличивает М с 1/3 до 1/2 (и уменьшает до нуля Б). Тут, конечно, надо оговориться, что все зависит от условий эксперимента - как ведущий подбирает второй конверт (а ведь он делает это!).

    В эксперименте без ведущего, при выборе из 6ти конвертов, случай, когда выпадает С имеет 50% вероятность. То есть, если вам выпала какая-то сумма, то вероятнее всего это именно С (а не М или Б).

    Имеет ли смысл менять решение и выбрать второй конверт в эксперименте с ведущим? Это зависит от того, каким правилом он сам руководствовался при выборе этих 2х конвертов из 6ти - а ведь мы этого не знаем!!

    ОтветитьУдалить
  11. cosmichorror, Вы напрасно меняете условие исходной задачи, в которой всё чётко определено. Зачем выдумывать ведущего, который может на что-то влиять? Так мы теряем чистоту конструкции.

    Повторю условие: у казино есть способ, позволяющий сформировать пару конвертов по числу от 0 до 1. С вероятностью 1/2 будет сформирована пара (1, 10). С вероятностью 1/4 будет сформирована пара (10, 100). И так далее.

    А испытуемый выбирает один из двух конвертов, сформированных таким образом.

    ОтветитьУдалить
  12. Анонимный06.06.2010, 0:37

    Смысл следующий. Человека абсолютно не интересует алгоритм установки сумм в конвертах. Он знает одно: во втором либо 1/10х от первого, либо 10х от первого. Шанс того, что он попал на хороший конверт = 50%. Шанс того, что на плохой - 50%. Если он будет всегда брать второй, то в итоге получит 50% * 1/10k + 50% * 10k. Если же он будет брать только первый, то получит тоже 50% * 1/10k + 50% * 10k. Таким образом, от взятия второго конверта ничего не изменится. Пока не знаю как чётко сформулировать (как в итоге вышло с островитянами и новой информацией), но определённо алгоритм выбора сумм конвертов не должен участвовать в рассуждении. Знания теории вероятностей пока нет.

    С уважением,
    Berserker.

    ОтветитьУдалить
  13. Интуиция - как женщина. Послушай ее и сделай наоборот. Вот и вся математика.

    ОтветитьУдалить
  14. Илья, вы снова забыли отнять от мат ожидания замены сумму, которая в первом конверте. А ведь он ее потеряет.

    И тогда игру можно немножко немного модифицировать.

    Допустим в конвертах бумажки с цифрами. После вскрытия первого конверта игроку предлагается за сумму, написанную в нем открыть второй конверт.

    Математика остается точно такой-же а вот парадокс пропадает.

    Или если на пальцах это очень "хорошая" для игрока игра. И в нее надо играть.

    ОтветитьУдалить
  15. Антон, почему же забыл?
    Я честно доказал, что если игрок нашёл в случайно взятом конверте X, то во втором конверте он может ожидать 3.4*X в среднем. Другими словами, замена конверта приводит к увеличению его суммы на 2.4*X.

    Но каким образом исчезает парадокс из-за того, что мы это явно сформулировали?

    Здравый смысл упорно сопротивляется утверждению, что выгоднее всего брать любой из двух конвертов, а потом его менять на второй. И я разделяю эти сомнения :)

    ОтветитьУдалить
  16. Анонимный08.06.2010, 14:42

    Ага, еще здравый смысл сопротивляется тому, что на длинном отрезке столько же точек, сколько на коротком.

    С бесконечностями вообще надо быть осторожным.
    А если от бесконечности уйти (аналогично вариантам решения в википедии для Санкт-Петербургского парадокса) - то здравый смысл успокоится =).

    // aamonster (OpenId что-то не пашет)

    ОтветитьУдалить
  17. При решении этой задачи допущена довольно частая ошибка, которая и приводит к странному результату. Конечно, никакого парадокса тут нет, так же как нет парадокса и в знаментиом «парадокс Монти-Холла». А именно — неверно построена математическая модель эксперимента.
    Для простоты понимания, сначала рассмотрим «парадоксе Монти-Холла». Здесь случайное событие происходит в тот момент когда игрок выбирает дверь. Он угадывает дверь за которой автомобиль с вероятностью 1/3 и дальше уже никаких случайных событий не происходит. И потому ответ получается именно таким. А при «интуитивном» использовании инструментов теорвера мы считаем что случайное событие проиходит в момент когда он выбирает из 2ух дверей. Потому и получаем неверный ответ ½.
    Теперь рассмотрим задачу двух конвертов. Рассматривать я тут буду немодифицированную, потому что ошибка и там и там одна и та же. Я не буду тут учитывать всякие невозможные суммы, неравномерные распределения и подобные вещи. Это для раскрытия проблемы вообще ненужно, так как решение неверно уже в чисто-математической области и брать какие-то дополнительные факторы из реальной задачи нет необходимсоти. Проблема в другом.
    В исходной задаче двух конвертов происходит 2 случайных события:
    1.Выбирается случайно X из всех положительных вещественных чисел(распределение равномерное), и такая сумма помещается в один из конвертов. И по нему однозначно определяется сумма 2X, которая помещается в другой конверт.
    2.Случайно выбирается один из конвертов. Распределение, так же, равномерное, т.е. 50/50.
    Когда игрок открывает выбраный конверт, он там видит некую сумму. Но это вовсе не X. Это некая сумма A, соотношение которой с X игроку неизвестно. Он знает только что либо X=A, либо 2X=A. Причем с равной вероятностью, а значит матожидание MX=3/4A. Далее можно аналогично посчитать и матожидание X через неизвестную велечину B, где B – неизвестная сумма во втором конверте. Очевидно, что мы получим MX=3/4B. Таким образом получаем B=A. ЧТД :)
    Это верное решение (по крайней мере я не нашел тут ошибок).
    А что же такое в неправильном решении? Та матмодель, которая дана для неправльного решения построена совсем на других случайных событиях:
    1.Выбирается случайно X из всех положительных вещественных чисел(распределение равномерное), и такая сумма помещается в первый конверт, который будет открыт.
    2.После того как игрок видит сумму X(ну или до, это уже не имеет значения), во второй конверт кладется 2X или 0,5X с вероятностями 50 на 50.
    Как видно, игра совсем другая. Более того, для этой игры выигрышная стратегия действительно заключается в том чтобы, увидев сумму в первом конверте, забрать деньги из второго.
    Так что учитывать такие дополнительные факторы как невозможность положить в конверт меньше 1 копейки или больше трилиона (ну или там поболее) совсем необязательно.

    ОтветитьУдалить
  18. Да, на последок хотел предложить еще один интересный «парадокс». Он почти в точности совпадает с «парадоксом Монти-Холла», но, помоему, более смешной.
    Закон подлости:
    Когда я прихожу на остановку и жду автобуса, то первый раз когда я вижу свой автобус, он идет не в том направлении.
    Строим матмодель эксперимента:
    Автобус едет по линейному маршруту, т.е. без колец и петель.
    Автобус идет по маршруту с одной скоростью и мгновенно разворачивается в концах маршрута (и только в них).
    Длина маршрута автобуса 1 (автобус ходит от 0 до 1)
    Я выхожу на остановку в случайной точке его маршрута, т.е. точка моего появления на маршруте случана и распределение равномерно на промежутке от 0 до 1.
    Моя цель, т.е. точка на маршруте, в которую я хочу добраться на автобусе, так же случайна и распределение равномерно на промежутке от 0 до 1.
    Я выхожу на маршрут автобуса в случайное время, т.е. автобус находится в случайной точке своего маршрута и движется в случайном направлении. Оба распределения так же равномерны.
    Я вижу автобус в тот момент, когда его местоположение совпадает с моим.
    Вот такая вот модель, вроде ничего не забыл.
    Вопрос, с какой вероятностью автобус будет двигаться в направлении от моей целевой точки, когда я его увижу впервые?
    Интуитивное применение теорвера говорит ½. А правильный расчет дает ответ 2/3. Т.е. закон подлости работает... :)))))
    Может кому будет интересно, кто еще не видел этой задачи.

    ОтветитьУдалить
  19. Илья, спасибо огромное за то, что вы так изящно развеяли миф о том, что для "ликвидации" этого парадокса достаточно потребовать "корректного" распределения сумм. А миф этот очень долго отвлекал всех от поиска верного пути!
    На самом деле разгадка в том, что сразу после выбора конверта игроком вероятности удачного и неудачного обмена принмают значения 0 и 1 (хоть мы и не знаем, в каком порядке), поскольку невыбранный конверт - лишь один. Все остальные рассматриваемые вероятности - лишь усреднения этих нулей и единиц по различным выборкам. Но при наличии связи самой случайной величины и её усредняемых вероятностей вычисление матожиданий по средним становится бессмысленным.
    Более подробно я попытался всё это изложить здесь:
    http://burykind.blogspot.com/2010/09/blog-post.html
    С уважением. Денис.

    ОтветитьУдалить
  20. BurykinD,
    ответил Вам в комментариях по этой ссылке.

    ОтветитьУдалить
  21. Анонимный25.02.2011, 2:31

    к сожалению вы не первые... подобный опыт был описан в фильме двадцать одно :)

    ОтветитьУдалить

Понравилась заметка? Подпишитесь на RSS-feed или email-рассылку.

Хотите поделиться ссылкой с другими? Добавьте в закладки:



Есть вопросы или предложения? Пишите письма на адрес mytribune АТ yandex.ru.

С уважением,
      Илья Весенний