28 янв. 2010 г.

Считаем вероятности

Добрый день, дорогие читатели!

Продолжаем делать добрые дела вместе с вами:
- в августе прошлого года вы исправили статью википедии, содержавшую явный бред по поводу задачи о двух конвертах,
- на этой неделе, разбираясь с сектантами на острове Беззеркалья, вы исправили другую статью википедии. И это тоже добавило адекватности всемирной энциклопедии (жаль, что ту статью пока никто не перевёл на русский язык).

Но можно ли на этом остановиться? Увы, плюсы открытой википедии часто становятся её минусами: любой человек, не разбирающийся в предмете, может внести в неё что угодно. И это делается не со зла, а из-за искренней убеждённости в своей правоте (логические парадоксы умеют перетягивать в неправильную сторону). А понимающим людям часто даже не приходит в голову читать подобные статьи, поэтому ошибки такого типа копятся (а потом тиражируются, например, журналистами).

В наш век быстрого распространения бреда информации есть два варианта: уметь фильтровать откровенную ложь или слепо следовать за красивыми словами тех, кто даже не понимает своей собственной позиции.

На мой взгляд, разбор логических, геометрических и вероятностных задач очень полезен. Дело в том, что человек, разобравшийся с подобным решением, уже не так легко верит на слово красивым высказываниям о вероятностях и математических ожиданиях, не покупается на цветные графики и чертежи. А это несколько ограничивает влияние манипуляторов на действия большинства.

Поэтому сегодня я предлагаю вернуться к парадоксу двух конвертов, чтобы разобрать один частный случай. Я уверен, что многие из вас сами могли найти, понять и исправить ту ошибку. Но уже несколько месяцев она висит в статье википедии, поэтому я предлагаю в неё вникнуть чуть подробнее.

Коротко напомню постановку задачи: есть два конверта, в одном из которых находится сумма вдвое большая, чем в другом. Игрок выбирает один конверт, пересчитывает в нём деньги, а после этого решает, оставить его себе, или взять другой.

Интуиция подсказывает, что если в первом вытянутом конверте находится X денег, то во втором с раными вероятностями будет X/2 и 2X. В прошлом году мы разобрались с этим заблуждением. Но до сих пор поступают комментарии от людей, которые не очень уверенно умеют рассчитывать вероятности сумм во втором конверте для частных случаев.

Да и в упомянутой статье википедии содержатся неверные выкладки. Цитата: «Например, если предположить, что сумма в меньшем конверте равномерно распределена между 10 руб. и 100 руб., очевидно такое:
* Если выпало 15 руб., в другом конверте определённо 30 руб. (7,5 быть не может). Поэтому требуется брать другой конверт.
* Если выпало 25 руб., в другом может быть как 12,5 руб., так и 50 руб., но вероятность второго больше — желательно брать другой конверт.
* Если выпало 90 руб., в другом может быть как 45 руб., так и 180 руб., при этом больше вероятность первого — лучше не брать другой конверт.
* Если выпало 100 руб., в другом конверте определённо 50 рублей — ни в коем случае не брать другой конверт
».

Вам тоже кажется, что последние три пункта как минимум странные? И то, что они предваряются словами, «очевидно такое», никак не улучшает ситуации.

Давайте честно рассчитаем вероятности! В меньшем конверте находится случайное число от 10 до 100, поэтому в большем - от 20 до 200. Это значит, что вытянув конверт, мы можем получить какое-то число от 10 до 200. Давайте разделим этот интервал на три части:
1) 10 <= X < 20,
2) 20 <= X <= 100,
3) 100 < X <= 200.

Чем хороши первый и третий диапазоны? Тем, что попав в них (не важно с какой вероятностью), мы точно знаем, сумма в нашем конверте X является большей из двух сумм в конвертах или меньшей. Это значит, что если X<20 или если X>100, то мы на 100% уверены, что делать.

Осталось разобраться со средним диапазоном. Давайте поймём, как формируются конверты:
- кто-то умеет генерировать случайные величины Y от 10 до 100, равномерно распределяя числа в этом диапазоне,
- кто-то другой берёт эти числа, чтобы сформировать пару для конверта (Y, 2Y) - это наши равновероятные элементарные исходы,
- мы (игрок) вытягиваем число X, открыв случайный из этих двух конвертов.

Разбираем парадокс двух конвертовИ как же было получено это число X? Очень просто - оно оказалось большим или меньшим в сгенерированной паре (Y, 2Y). Другими словами, нам досталась одна из пар (X, 2X) или (X/2, X). А мы вытянули из неё число X.

Но мы же знаем, что меньшее число в этих парах - случайная величина, имеющая равномерное распределение на диапазоне от 10 до 100. Это означает, что все пары (Y, 2Y) появляются с равными вероятностями. И из этого следует, что вероятности генерации пар (X, 2X) и (X/2, X) одинаковы, так? Поэтому, если уж нам досталось число X от 20 до 100, то вероятности того, что во втором конверте будет 2X или X/2 равны, верно?

Поэтому «правильный» вывод состоит в следующем:
- Если вытянутое число больше 100, то менять конверт не следует, так как это гарантированно приведёт к уменьшению выигрыша,
- Если вытянутое число меньше 20, то обязательно надо сменить конверт, так как это гарантирует увеличение выигрыша,
- В остальных случаях тоже стоит сменить конверт, так как вероятность удвоения суммы равна вероятности её сокращения в два раза, но возможный выигрыш при замене больше возможного проигрыша.

Всё это очень просто и для дискретного случая (когда в конвертах могут быть только целые числа, например). Только тогда придётся вникать в чётность (так как нечётный X однозначно указывает на то, что следует поменять конверт), а это сделает решение чуть более громоздким.

Хорошего вам дня и интересного чтения энциклопедий!

P.S.
кстати, кто заметил ошибку в рассуждениях выше? ;)

Дополнение: пояснения даны в следующей заметке.

18 комментариев:

  1. > возможный выигрыш при замене больше возможного проигрыша.

    А вот тут я бы включил теорию субъективной полезности. Если я вытяну конверт, допустим, с миллионом - я не стану его менять.

    ОтветитьУдалить
  2. Анонимный28.01.2010, 13:29

    "Кто-то умеет генерировать случайные вел(E->И)чины"

    ОтветитьУдалить
  3. Мне кажется Вы разобрали совершенно другую задачу, а не задачу о конвертах.
    В задаче о конвертах, приведённой на http://www.membrana.ru/articles/simply/2009/08/19/174500.html нет ограничений на суммы. В этом-то и весь смысл задачки.

    ОтветитьУдалить
  4. kosiakk, это понятно, но мы сейчас говорили о точной вероятности :)

    Уважаемый аноним, спасибо за правку.

    dlazerka, Вам правильно кажется! Я сейчас разобрал частный случай, в рассмотрении которого в википедии сделана ошибка.

    А исходная задача была подробно разобрана в прошлой заметке. Там же мы обсудили ошибки авторов статьи с мембраны.

    ОтветитьУдалить
  5. Не совсем понятно, обсуждается ли дискретный случай или непрерывный. Если дискретный, то при нечетных X выражение X/2 не имеет смысла и нужно обязательно учитывать четность. Если непрерыный, то вероятность каждого конкретного вытягивания равна нулю. Какова, например, вероятность вытянуть ровно 10 + pi рублей? А 10 + корень из 2? А ровно 10 рублей? Очевидно, что эти вероятности равны, и они равны нулю, поэтому рассматривать их бесполезно. Вместо этого нужно использовать связанное с бесконечно малыми и потому намного более парадоксоопасное понятие плотности вероятности.

    ОтветитьУдалить
  6. На мой взгляд, ошибка в следующем. Вероятность того, что в бОльшем конверте от 20 до 100 рублей - 44%, а в меньшем - 80%. Таким образом, при случайном выборе конверта, в котором сумма от 20 до 100 рублей он чаще будет оказываться меньшим, и его действительно лучше менять.

    ОтветитьУдалить
  7. Для любой суммы выигрыша из отрезка [20; 100] ожидание выигрыша в случае смены конверта составляет 3*X/2, т.к. условная вероятность того, что на этом промежутке (независимо от конкретного числа) вытащен меньший конверт на самом деле 2/3, а не 1/2.

    ОтветитьУдалить
  8. Илья, на сколько я понимаю, в даной заметке Вы ведете речь исключительно лишь о некорректной, или неправильной (с Вашей точки зрения) трактовке вероятности событий 1-4 описанных в известной статье википедии о "Парадоксе двух конвертов" в разделе "Стохастический случай с известным распределением", цитату из которого Вы привели выше.
    В таком случае согласен с Вами, так как тоже считаю, что автор этого раздела несколько поторопился с выводами.
    Допускаю, что п.п.2 и 3 были бы справедливы в том случае, если бы сумма во втором конверте могла принимать любые значения в интервале 20<=Y<=200 при уже открытом первом конверте и известном Х в интервале 10<=Х<=100. Однако таких значений всякий раз всего два, соответственно, в данном случае, вероятность выпадеия большей или меньшей суммы в п.п.2,3 составит 50% (а не больше/меньше, как утверждает автор). А вот ожидание возможного выигрыша действительно диктует нам необходимость поступать именно так, как рекомендует автор - менять конверт.
    Касательно же п.4, полагаю автор просто описАлся, и, на самом деле, имел ввиду "101".
    Также согласен с тем, что грустно, если допускаются подобного рода "описки" в таком издании как википедия.

    ОтветитьУдалить
  9. colog, обсуждается непрерывный случай. Дискретный совсем простой, но там такой эффект не проявится, поэтому я не стал его расписывать.

    Алексей, здорово! Это достаточно ясное контробъяснение.

    lionel, да, всё верно, 3/2. А где ошибка в моём рассуждении? ;)

    Smith, задача там сформулирована корректно, но выводы сделаны неверные. И Вы повторяете их, говоря, что вероятности большей и меньшей суммы во втором конверте равны 50%.

    В пункте 4 автора зачем-то поправили, не разобравшись. Изначально первый и четвёртый пункт были корректными, но "добро пожаловать в открытую энциклопедию, которую может менять каждый"...

    ОтветитьУдалить
  10. В общем, проблема в обращении с нулевыми вероятностями так, как будто они положительны. Применение к собятиям нулевой вероятности формулы Байеса, которая, можно сказать, незримо стоит за всеми интуитивными рассуждениями о вероятностях зависимых событий, приведет к делению на ноль.

    Вместо событий нулевой вероятности вроде "в наименьшем конверте ровно X рублей", нужно рассматривать события положительной вероятности вроде "в наименьшем конверте от X-e до X+e рублей", где e сколь угодно малое положительное число.

    ОтветитьУдалить
  11. Илья. Вы, к моему сожалению, вероятно в силу обстоятельств, невнимательно прочитали мой последний пост и сделали скоропалительные выводы. Попытаюсь обьяснить.

    "Smith, задача там сформулирована корректно, но выводы сделаны неверные. И Вы повторяете их, говоря, что вероятности большей и меньшей суммы во втором конверте равны 50%."

    Я и не говорил о некорректности формулировки задачи, я вел речь исключительно о, на мой взгляд, некоректности в суждениях о вероятности в п.п.2.3,4 определенного раздела указанной статьи. Чувствуете разницу?

    Теперь о 50% вероятности. Здесь для наглядности я позволю себе процитировать Ваши слова: "- В остальных случаях тоже стоит сменить конверт, так как вероятность удвоения суммы равна вероятности её сокращения в два раза, но возможный выигрыш при замене больше возможного проигрыша". Так вот, п.2 и п.3 в указанном разделе википедии описывают именно аналогичныйе случаи (условно говоря такие, как в части 2 в предложенном Вами в настоящем посте разделении интервала на части), о чем я и написал в предыдущем посте.

    "В пункте 4 автора зачем-то поправили, не разобравшись."

    Вот цитата из стать википедии о которой идет речь: "...если предположить, что сумма в меньшем конверте равномерно распределена между 10 руб. и 100 руб., очевидно такое:" Так вот, если в меньшем конверте сумма от 10 до 100 по условию, а выпало 100 (как об этом говорится в п.4), то вероятность такая же, как в п.п. 2 и 3 с рекомендацией менять. А вот если 101 - тогда не менять 100%. Так в чем я не прав?

    "...но "добро пожаловать в открытую энциклопедию, которую может менять каждый"..." А это Вы к чему или о ком?

    ОтветитьУдалить
  12. Рассмотрим 18 равновероятных ситуаций, выбираем один из двух конвертов, а сумму в конверте меняем с шагом 10 руб. (9 интервалов 10-20 20-30 ... 80-90 90-100).
    С вероятностью 1/18 в меньшем конверте от 10 до 20 руб.
    С вероятностью 5/18 в большем конверте от 100 до 200 руб.
    То есть в 6 из 18 ситуаций решение однозначно.
    А если в конверте сумма от 20 до 100 руб, непонятно какой у нас конверт, но с вероятностью 4/18 это больший и с вероятностью 8/18 меньший. отсюда ожидаемый выигрыш (2X/2+2X)/3=X -> если видим сумму от 20 до 100 можно поступать как угодно.

    ОтветитьУдалить
  13. Smith, возражение по формулировкам принимаю. Наверное, я Вас не понял.

    Но вот следующие Ваши слова очень удивляют: «Здесь для наглядности я позволю себе процитировать Ваши слова: "- В остальных случаях тоже стоит сменить конверт, так как вероятность удвоения суммы равна вероятности её сокращения в два раза, но возможный выигрыш при замене больше возможного проигрыша"».

    Дело в том, что я осознанно написал это неверное утверждение (чтобы в следующей заметке разобрать эту ошибку). А Вы, споря со мной, ссылаетесь на мои же слова, в которых содержится ложное утверждение. Как выше уже написали в комментариях, если в первом конверте такой X, что 20<=X<=100, то вероятности сумм 2X и X/2 во втором конверте не равны 50%. Они равны 2/3 и 1/3, соответственно.

    Про 101 же Вы правы, конечно. Не принимайте близко к сердцу :) Кстати, этот четвёртый пункт уже откатили обратно в википедии.

    А «Добро пожаловать» обращено ко всем, кто хоть изредка пользуется этой энциклопедией. Часто можно встретить откровенную ерунду, которую привнёс в статью человек, решивший сэкономить время на размышления :( Увы, исправить «чужую ошибку» быстрее, чем понять, что сам заблуждался. И слишком многие идут по этому пути.

    AAbrosov, у Вас верное и краткое рассуждение, но ошибка в последней строчке. Должно быть так:
    (X/2+2*2X)/3=3X/2 -> если видим сумму от 20 до 100, то следует поменять конверт, чтобы увеличить средний выигрышь в полтора раза.

    ОтветитьУдалить
  14. 2Илья: "Как выше уже написали в комментариях, если в первом конверте такой X, что 20<=X<=100, то вероятности сумм 2X и X/2 во втором конверте не равны 50%. Они равны 2/3 и 1/3, соответственно."

    Где "выше написали"? Вы имеете ввиду вот это: "...т.к. условная вероятность того, что на этом промежутке (независимо от конкретного числа) вытащен меньший конверт на самом деле 2/3, а не 1/2"? Здесь автор ведет речь о вероятности выпадения Х в указанном интервале, и не более того. Я же комментирую п.п.2 и 3 википедии, где предложены примеры, когда уже априори известно, что Х выпал именно в этот диапазон, и при этом утверждается (цитирую из википедии): "Если выпало 90 руб., в другом может быть как 45 руб., так и 180 руб., при этом больше вероятность первого...". Я же утверждаю, что не "больше вероятность первого", а вероятности равны. Также, как при попадании Х в диапазон 2, т.е. 20<=Х<=100 из предложенного вами разбиения, вероятность того, что Y будет большим или меньшим числом составляет именно 1/2, или 50%.

    Попробую объяснить на примере. Предположим, Х=20,01. Тогда Y с равной вероятностью может оказаться равным как 10,05 так и 40,02. Если Х=99,98, то Y может оказаться равным как 49,99 так и 199,96 опять же с равой вероятностью. И так на всем диапазоне [20;100]. С вероятностью 1/2 или 50%. Если вы считаете, что я ошибаюсь, тогда, пожалуйста, поясните, из чего следует утверждение, что вероятности для Y на данном отрезке составят 1/3 и 2/3 для меньшего и большго значения соответственно.

    ОтветитьУдалить
  15. Smith, доказательство приведено в следующей заметке.

    Если X=20.01, то с вероятностью 1/3 во втором конверте будет 10.005, а с вероятностью 2/3 во втором конверте будет 40.02.

    ОтветитьУдалить
  16. Вы правы, Илья, я не учел плотности распределения. Снимаю свои претензии к п.п.2.3 статьи в википедии и приношу извинения автору. Дело в том, что ведутся сразу несколько обсуждений указанной темы в разных местах и некоторые понятия очевидные для одного случая, иногда, к сожалению, упускаются (мной в частности) в другом.

    Вообще говоря, на мой взгляд, рассмотрение данного частного случая не оправдано включено в известную статью википедии. Мало того, что дали ограничение планки "сверху", установили непрерывное распределение, так еще и ограничили меньшую сумму половиной интервала.

    Мне кажется, правильнее было бы разобрать, как минимум, такой же случай, но без ограничения меньшей суммы, или с неизвестным распределением, и верхней планкой, либо с известным распределением, но без верхней планки. Впрочем, это мое личное мнение.

    ОтветитьУдалить
  17. Smith, здорово, что мы поняли друг друга!
    И я согласен с Вами, что статью эту (и многие другие) надо править и править. Увы, судя по всему, это почти ни у кого интереса пока не вызвало... :(
    Но я верю, что постепенно мы выправим подобные глупые фактические неточности из статей :)

    ОтветитьУдалить
  18. Только сейчас дошло, в случае если в конверте лежит любая сумма, то ошибка в рассуждениях в самом начале. В этом случае вероятности вытащить двойную и половинную суммы не равны. Открывая первый конверт мы не получаем 1/2 и 1/2 вероятность для каждого конверта. Если я не ошибаюсь прикинув в уме вероятность того, что в конверте будет меньшая сумма - 2/3, большая - 1/3. Надо брать лист бумаги и карандаш и писать пределы :)

    ОтветитьУдалить

Понравилась заметка? Подпишитесь на RSS-feed или email-рассылку.

Хотите поделиться ссылкой с другими? Добавьте в закладки:



Есть вопросы или предложения? Пишите письма на адрес mytribune АТ yandex.ru.

С уважением,
      Илья Весенний