13 янв. 2012 г.

Невозможное возможно!

Добрый день, дорогие любители теории вероятностей.

Сегодня мы снова играем с Якубовичем и его шкатулками. Прелесть этой задачки в том, что опять что-то кажется очевидным, а оно не только таковым не является, но ещё и, вообще говоря, оказывается ошибочным.

Итак, Якубович предлагаем нам поднос с N шкатулками (N — натуральное число больше единицы). В каждой шкатулке или находится приз, или вообще ничего нет. Другими словами, есть N шкатулок и сколько-то призов (не больше, чем N), причём в одной шкатулке не может лежать больше одного приза.

Далее состоялся важный диалог:
(Якубович) - Как вы думаете, с какой вероятностью в случайно выбранной шкатулке окажется приз?
(игрок) - Я не знаю, потому что не имею никакой информации о количестве призов в этих шкатулках.
(Якубович) - Верно! Но я сообщу эту информацию: с вероятностью p0 в шкатулках нет призов, с вероятностью p1 в шкатулках 1 приз, с вероятностью p2 — 2 приза и так далее.

Другими словами, игрок знает N (т.к. уже посчитал количество шкатулок на подносе) и только что узнал все вероятности p0, p1, p2 и так далее.

(игрок) - Теперь я могу посчитать. Вероятность того, что в случайно открытой шкатулке будет приз, равна P. (Чему равно P? Это первый вопрос из окончания заметки)
(Якубович) - Отлично. Открывайте шкатулку!

Когда игрок открыл случайную шкатулку, он обнаружил приз (повезло). Пока радостный игрок укладывает приз себе в карман, хитрый Якубович стремительно захлопывает ставшую пустой шкатулку, после чего быстро-быстро перемешивает шкатулки на подносе.

(Якубович) - Поздравляю с призом! Теперь, когда призов на подносе стало на один меньше, что стало с вероятностью того, что в случайно открытой шкатулке будет приз?

Тут я предлагаю читателю задуматься. В самом деле, если шкатулок осталось прежнее количество, а призов стало на один меньше, то кажется вполне естественным, что вероятность уменьшилась?.. Да? Точно? Уверены?

Тогда продолжаем наш разговор!

(Якубович) - Какая теперь вероятность найти приз в случайно выбранной шкатулке?
(игрок) - У меня есть все данные, чтобы её посчитать. Получилось Q. (Чему равно Q? Это второй вопрос.)
(Якубович) - Интересно у вас получилось! Выходит, что Q больше P? Вероятность выросла?
(игрок) - Да, она выросла.
(Якубович) - Ну тогда открывайте ещё одну шкатулку
...

Что случилось дальше мы не знаем, потому что началась рекламная пауза. Но и увиденного уже хватает, чтобы подумать.

Вопросы следующие:
1. Какую вероятность P назвал игрок, когда Якубович спросил его о вероятности нахождения приза в случайной шкатулке?
2. Какую вероятность Q назвал игрок после выигрыша, когда Якубович опять спросил его о вероятности нахождения приза в случайной шкатулке?
3. Может ли Q быть равным P? Может ли Q быть больше P? Приведите примеры или способ их построить.
4. Может ли Q быть равным P, если p0=p1=p2=...=pN? Может ли Q быть больше P, если p0=p1=p2=...=pN? Приведите примеры или способ их построить.
5. Почему нам кажется, что Q обязано быть меньше P?

Хорошей вероятностной пятницы!

57 комментариев:

  1. Анонимный13.01.2012, 9:13

    5. Потому что если предположим что призов было k, то P = k/N, а Q = (k-1)/N. Из этого легко доказать, что Q<P. А игрок просто не знает теорию вероятностей, поэтому неправильно посчитал.

    ОтветитьУдалить
    Ответы
    1. Если бы k было известно, то всё так бы и было, как Вы пишете. Но мы знаем только вероятности различных k, а не само k. В этом и разница.

      Удалить
  2. 0) Надо было Якубовича переименовать Шрёдингером, раз у него призы УЖЕ лежащие в коробке всё ещё имеют вероятности.

    1) Если призов m, то верояность удачи m/N.
    Тогда общая вероятность P=Sum(for i=0..N)pi*i/N

    2) Исключается вариант, что призов было 0. Значит новые вероятности: p0'=0; pi'=pi/(p1+p2+p3+...+pN)=pi/(1-p0)
    Q=Sum(for i=0..N)pi'*(i-1)/N=Sum(for i=1..N)pi'*(i-1)/N=Sum(for i=1..N)pi*(i-1)/N/(1-p0)

    3) Может.
    Пример 1: 2 шкатулки. p0=0.5; p1=0; p2=0.5
    P=Q=50%
    Пример 1: 2 шкатулки. p0=0.99; p1=0; p2=0.01
    P=1%
    Q=50%
    Q>P

    ОтветитьУдалить
    Ответы
    1. > 2) Исключается вариант, что призов было 0.
      Не только этот вариант исключается, но и вероятности остальных вариантов корректируются.
      Рассмотрите случай когда n = 100, p_1 = 99/100, p_100 = 1/100, p_i = 0 для прочих i
      P = 0.0199
      Q = 0.99

      Удалить
    2. Не пройдет. При таких исходных данных после первого шага появится p_0=99/100 и вероятность Q будет меньше Р.

      А на счет Шредингера - замечание верное и первым в голову приходит в контексте "где-то дурят". Хотя, немного подумав, можно представить себе технологию размещения призов, при которой количество призов будет вероятностной величиной и неизвестно ведущему.

      Удалить
  3. Анонимный13.01.2012, 10:02

    1. по поводу вероятности P согласен с предыдущим автором.
    2. когда мы забираем один приз, мы можем не учитывать появившуюся пустую коробку, так как знаем, что она пуста
    соответственно, если P=M/N, где M - количество призов, то Q=M-1/N-1
    предположим, что Р=М, тогда
    M/N=M-1/N-1, это справедливо если M=N, то есть в каждой шкатулке есть приз.
    соответственно, при M<N вероятность Q<P, то есть в любом случае (так как призов не может быть больше шкатулок)

    ОтветитьУдалить
  4. 4) Не может.
    Пусть p0=p1=p2=...=pN=p.
    P=Sum(for i=0..N)pi*i/N=Sum(for i=1..N)pi*i/N=p/N * Sum(for i=1..N)*i=p/N*N*(N+1)/2=p*(N+1)/2
    Q=Sum(for i=1..N)pi*(i-1)/N/(1-p0)=Sum(for i=1..N)p*(i-1)=p/N/(1-p)*Sum(for i=1..N)(i-1)=p/N/(1-p)*N*(N-1)/2=p*(N-1)/(1-p)/2
    P/Q=(N+1)/(N-1)*(1-p)
    Так как p0+p1+p2+...+pN=1.
    p=1/(N+1)
    P/Q=(N+1)/(N-1)*(1-(1/(N+1)))=(N+1)/(N-1)*(N+1-1)/(N+1)=N/(N-1)>1, для любых натуральных N>1.
    Значит P>Q.
    5) Потому, что на самом деле x призов в шкатулках уже лежат, и вероятности которые называет нам Якубович не имеет ничего общего с реальностью. Призы на момент его слов УЖЕ лежат, значит на самом деле px=1, а остальные вероятности равны нулю. Значит первый раз шанс угадать был x/P, а во второй раз (x-1)/P.

    ОтветитьУдалить
  5. Отметим сразу, что р0 не равно 1.

    Ответы такие:

    1) Р = (1р1+2р2+3р3+ ... + NрN)/N

    2) Q = P/(1-p0) - 1/N

    3) Может. Может. Оба случая можно удовлетворить соответствующим подбором р0 и рN, приравняв все остальные вероятности нулю.

    4) Нет. Нет. Потому что в этом случае Р=1/2, а Q=1/2 - 1/(2N)

    ОтветитьУдалить
  6. // LaTeX в комментариях недоступен?

    1. P = (1 / n) * sum(k = 1..n, k * p_k)
    2. Q = (1 / n) * sum(k = 1..n, (k - 1) * k / n / P)
    3.
    a) Q = P = 1 / 2, если, например n = 2, p_0 = 1 / 2, p_1 = 0, p_2 = 1 / 2
    b) Q > P, если, например, n = 2, p_0 = 1 / 100, p_1 = 0, p_2 = 99 / 100
    4. Тут P = 1 / 2
    a) Q = P, если n = 4, p_i = 1 / 5 => Q = P = 1 / 2 (кажется это единственное n, удовлетворяющее условию)
    b) Q > P, если n > 4, например n = 5, p_i = 1 / 6 => Q = 8 / 15 > P
    5. Не люблю такие вопросы. Может быть потому что человеку кажется, что вероятность того, что k шкатулок содержали приз не изменилась после первого вытаскивания приза - та же фигня что в парадоксе Монти-Холла. А т.к. для любого k теперь остался k - 1 приз, то можно подумать, что шансы получить приз уменьшились. На самом же деле вероятности изменились (были абсолютные, а стали условные - при условии что нам попалась шкатулка с призом), наиболее просто это понять по примеру из пункта 3.

    ОтветитьУдалить
    Ответы
    1. В 3. b. должно быть "Q > P, если, например, n = 2, p_0 = 99 / 100, p_1 = 0, p_2 = 1 / 100"

      Удалить
    2. Ну и здесь: 2. Q = (1 / n) * sum(k = 1..n, (k - 1) * k * p_k / n / P)

      Удалить
    3. sum(i = 0..N, p_i) должно равняться 1, не так ли?

      Удалить
    4. Увы, LaTex'а пока тут нет. Будем считать, что все его глазами умеют читать. Ну или быстро научатся, что полезно :)

      Удалить
  7. Анонимный14.01.2012, 10:19

    Для бесконечного N можно и не такое сделать :-)

    ОтветитьУдалить
    Ответы
    1. Для бесконечного N можно ещё круче - http://text-humour.blogspot.com/2012/01/blog-post_13.html :)
      Но здесь N строго натуральное число.

      Удалить
  8. Как-то скучно получилось. Нашел вероятности, но не нашел парадокса :).

    1. P = (1/N) * sum(n = 1..N, p_n * n)
    2. Q = (1/N) * sum(n = 1..N-1, p_(n+1) * n)
    3-4. P - Q = 1/N при любых p_i.
    Ergo, для любого конечного N:
    Q не может быть равно P,
    Q не может быть больше P.
    5. Нам кажется правильно. Это у игрока могло получиться Q > P, если он не сообразил нормировать вероятности p_i с учетом невозможности случая отсутствия призов.

    ОтветитьУдалить
    Ответы
    1. Анонимный14.01.2012, 15:37

      А что Вы ответите на предложенные в первых комментариях примеры?
      Надо или в них найти ошибку, или в Вашем доказательстве.

      Удалить
    2. Признаю свою ошибку :). Я сам пропустил нормирование вероятностей в своих выкладках.

      Правильный вариант такой.
      1. P = (1/N) * sum(n = 1..N, p_n * n)
      2. Q = (1/N) * (1/(1 - p_0)) * sum(n = 1..N-1, p_(n+1) * n)

      Разность P - Q = (1/N) * sum(n = 1..N, p_n * (1 - n*p_0)/(1 - p_0))

      3. Разность может быть отрицательной (равной нулю), если (необходимое условие) N * p_0 > 1.
      4. Если все p_i-тые равны между собой, то они равны 1/(N + 1). N * p_0 = N / (N + 1) < 0. Ответ на оба вопроса отрицательный.
      5. Нам кажется, что Q не может быть больше P, потому что нам не очевидно изменение пространства возможных исходов (выпадение случая, когда призов в шкатулках нет вообще). Или другими словами, неочевидна подмена абсолютной вероятности на условную.

      Удалить
  9. 1-2. Согласен с Sophist. По поводу Q: т.к. один приз убрали, то вероятность, что призов больше нет увеличилась на вероятность наличия одного приза, вероятность, что число призов равно 1 стала равна вероятности из 1ой ситуации, что призов 2, и т.д. А вероятность, что число призов равно N стала равно 0. Т.е. Q = (1/N) * sum(n = 1..N-1, p_(n+1) * n)
    3. P-Q у меня получилось равно sum(n = 1..N, p_n)/N, а т.к. sum(n = 0..N, p_n) = 1, то P-Q =(1-р_0)/N. Получается, P=Q при условии, что в шкатулках нет призов с вероятностью 100%, но игрок ведь уже выиграл один приз, значит Q не может быть равно P. Ну и конечно Q не может быть больше P
    5. Да вроде как правильно кажется))

    ОтветитьУдалить
    Ответы
    1. Да, по третьему пункту именно так. Я у себя недоглядел. Впрочем, вывод от этого не меняется.

      Удалить
    2. Анонимный14.01.2012, 18:45

      Но есть же пример с парой шкатулок, для которых p0=1/2; p1=0; p2=1/2. Тогда P=Q=50%.

      Удалить
    3. В этом примере P = 50%, Q = 100%.

      Удалить
    4. Анонимный14.01.2012, 19:30

      После вынимания одной монетки становится p0=0, p1=1, p2=0. А это значит, что Q=1/2. Почему вдруг Q=100%? Не понимаю, это я ошибаюсь или Вы :(

      Удалить
    5. Я :). Я забыл, что пустая шкатулка возвращается на место.

      Удалить
    6. Анонимный конечно прав. В случае пары шкатулок, когда {p0=1/2; p1=0; p2=1/2}, искомые вероятности равны: P=Q=1/2. И чтобы показать это наиболее убедительно, можно рассуждать следующим образом. Распределение p0=1/2; p1=0; p2=1/2 просто означает, что до открытия шкатулки, или обе шкатулки были пусты или обе были с призами. Следовательно, после открытия шкатулки и обнаружения в ней приза, становится очевидно, что вторая шкатулка тоже содержит приз. Игрок забрал один из двух призов, т.е. остается 1 приз в двух шкатулках. Вот почему Q=1/2.

      Удалить
  10. Хочется похвалить LisandreL за очень точные и грамотные ответы на все 5 вопросов. Сразу видно, что человек хорошо освоил арифметику теории вероятности. Но его (ее?) комментарий о том, что Надо было Якубовича переименовать Шрёдингером, раз у него призы УЖЕ лежащие в коробке всё ещё имеют вероятности вызывает очень серьезное беспокойство за его понимание смысла вероятности. Это довольно тонький момент, и LisandreL далеко не один в этом грехе - за ним целая школа со своим узким пониманием смысла понятия вероятность. Я не раз пытался объяснить на страницах этого блога, что я имею в виду. Попробую еще раз.

    1) Нет абсолютной вероятности, т.е. не имеет смысла говорить о вероятности в отрыве от субъекта (а точнее в отрыве от информации, которой обладает этот субъет), дающего оценку вероятности того или иного события.

    2) Якубович спрашивает о вероятности ИГРОКА, а не о СВОЕЙ вероятности.

    3) Нигде в условии задачи не сказано, что Якубович на самом деле знает сколько всего призов разложено по шкатулкам. Все что мы можем заключить это то, что он знает что-то о процедуре, которая используется для определения того, сколько же призов будет разложено по шкатулкам до выхода на сцену. Именно эту информацию он и сообщает игроку. Если это все, что Якубович знает, тогда вероятностные оценки ЯКУБОВИЧА и ИГРОКА должны просто совпадать (при условии, конечно, что они оба хорошо и грамотно владеют арифметикой).

    4) Если Якубович заглянул во все шкатулки (я повторяю, по условию задачи, мы не знаем заглянул он или нет на самом деле), то ЕГО вероятность будет, вообще говоря, отличаться от вероятности ИГРОКА по вполне понятной причине: у него больше информации.

    Так что Шрёдингер тут совершенно не причем.

    ОтветитьУдалить
    Ответы
    1. Согласен с тем, что Шрёдингер ни при чем (самого это резануло), но хочу дополнить.

      Нет смысла говорить о вероятности одиночного события. Всякий раз, когда я слышу: "Какова вероятность того, что в лежащих перед нами шкатулках ровно N призов?", -- я мысленно переформулирую для себя: "Если повторить, скажем, тысячу раз процедуру формирования шкатулок, в скольких случаях в них окажется ровно N призов?" (Понятно, что для абсолютной точности повторять надо не тысячу, и не миллион даже, а бесконечное число раз).

      Только это условие (принципиальная возможность повторить процедуру формирования шкатулок) дает нам право говорить о вероятности.

      Удалить
    2. Sophist, в классической теории (или "частотной" как ее часто называют по праву) действительно Нет смысла говорить о вероятности одиночного события.

      Но в теории, которая рассматривает вероятность просто как расширение дедуктивной Аристотелевской логики в область индуктивной логики, повторяющиеся события являются лишь очень узкой частью событий, которым можно приписать вероятность. Но на этот раз я не буду опережать события и лучше подожду сюрприз, который Илья методично готовить для своих читателей.

      Удалить
  11. The Bayesian revolution must go on.

    Для тех, кто сумел уловить и переварить по-настоящему смысл предыдущего комментария о комментарии LisandreL о Шрёдингере, продолжаем курс нелегкого переобучения.

    Илья предварил формулировку своей задачи следующим замечанием: Прелесть этой задачки в том, что опять что-то кажется очевидным, а оно не только таковым не является, но ещё и, вообще говоря, оказывается ошибочным.

    Это ирония судьбы, но похоже, что сам Илья упустил великолепную возможность уловить настоящую прелесть этой задачки.

    Дело вот в чем. К моменту, когда Якубович задал свой первый вопрос, у игрока уже есть огромное количество информации. А именно, он уже знает количество шкатулок, и что каждая шкатулка содержит не более одного приза. И когда Якубович спрашивает - Как вы думаете, с какой вероятностью в случайно выбранной шкатулке окажется приз?, как может игрок с чистой совестью отвечать - Я не знаю, потому что не имею никакой информации о количестве призов в этих шкатулках?

    Это полнейший абсурд с точки зрения интерпретации смысла вероятности как меры осведомленности. Вероятность - эта мера осведомленности! Чем больше у нас относящейся к данному вопросу информации, тем точнее и выше оценка нашей вероятности. С накоплением информации естесственно меняется ваша оценка - вот и вся наука познания.

    Вот почему автор Небесной Механики Пьер Лаплас говорит: Теория вероятности есть не что иное как сведенный к расчету здравый смысл.

    Вот почему основатель теоретической электродинамики Джеймс Максвелл говорит: В настоящее время логика как наука имеет дело только с утверждениями, которые являются несомненными, невозможными, или полностью неопределенными, т. е. с вещами, которых (к счастью) у нас практически никогда не бывает, чтобы делать выводы на их основе. Следовательно, настоящая логика этого мира – это исчисление вероятностей дающее величину вероятности, которая есть, или должна быть, в уме разумного человека.

    Вот почему Edwin Jaynes назвал свою книгу Probability Theory: The Logic of Science.

    Я не хочу лишить читателя творческого удовольствия поразмыслить и самому найти ответ на первый вопрос Якубовича: Как вы думаете, с какой вероятностью в случайно выбранной шкатулке окажется приз?

    ОтветитьУдалить
    Ответы
    1. Артур,
      пока я тут аккуратно готовлю почву для Вашей заметки в этом блоге, Вы торопите события :)
      Пока всё так: игрок с чистой совестью ответил, что не знает вероятность P, потому что он классический выпускник классического математического факультета. У него есть способы считать вероятности, которым его научили лектор и семинарист. И пока он пользуется только ими, потому что "так в книгах написано". И он понимает этот инструментарий, и его понимают другие математики (и даже Якубович).
      А вот потом мы сможем на примере и этой задачи вникнуть в более широкий взгляд на вероятность. Но сперва надо научиться решать её хотя бы в широко распространённом смысле. А то тут в комментариях пока не видно единства (одни приводят примеры, а другие публикуют доказательства, что примеры невозможно построить :)

      Удалить
    2. Илья, спасибо за тактичный ответ. Другой мог просто резануть: Не лезь в пекло вперед батьки :)

      Между прочим у меня в один момент возникла мысль, что эта задача хорошая прелюдия к глубокому обсуждению более содержательного понятия вероятности, но признаться не догадался, что Вы на шаг впереди меня. Настоящий педагог!

      Удалить
  12. Илья, Вы сами придумали этот интересный вариант задачки о шкатулках?

    ОтветитьУдалить
    Ответы
    1. Случайно услышал формулировку в метро. Увы, автора задачи пока не выяснил. Если найдёте первоисточник, поделитесь, пожалуйста.

      Удалить
  13. Выше я сделал очень неудачное высказывание, которое я хотел бы забрать обратно: Вероятность - эта мера осведомленности! Чем больше у нас относящейся к данному вопросу информации, тем точнее и выше оценка нашей вероятности.

    Внимательный и вдумчивый читатель мог, при желании, наказать за такое халатное заявление. Правильнее было бы сказать, что вероятность является функцией осведомленности, а не мерой осведомленности. Действительно, очень легко продемонстрировать, что бОльшая осведомленность (или больше информации, если угодно) не объязательно должно вести к большей или меньшей величине вероятности. В упомянутой книге Jaynes есть интересный и поучительный пример, где он как раз говорит о вышеупомянутой поправке и вводит очень важное понятие стабильности оценки вероятности. Но об этом в следующий раз.

    ОтветитьУдалить
    Ответы
    1. Анонимный23.01.2012, 16:29

      Уважаемый, Arthur Baraov.

      Извините, что встреваю, но коль уж речь о правильном понимании вероятности, хотел бы уточнить один момент.

      Вы пишите "вероятность является функцией осведомленности", что, тем не менее близко, по духу к "вероятность - эта мера осведомленности". В этом же убеждает ваше цитирование Лапласа. Т.е., недостаточная уверенность (определенность), происходит от недостаточной осведомлённости.

      Я, но на уровне простого обывателя, то же пытался сформировать у себя правильное понимание вероятности. И как-то я читал И. Пригожина. Схожее я читал у Виннера. Они писали о стреле времени, времени Бергсона (если я не ошибаюсь) и пр. (середина/начало 20 века)

      Так вот, основными их идеями является необратимость стрелы времени и невозможность демона Лапласа. Из-за того, что некоторые процессы случайны по своей природе. Пригожин и продемонстрировал такие процессы и начал их описывать точками бифуркации и прочим.

      А вот является ли ситуация со шкатулками случайной по своей природе, или её следует считать детерминированной но не полностью описанной... Вопрос.

      Антон

      Удалить
    2. Антон, я извиняюсь за запоздалый ответ. Я не подписался вовремя на эту заметку и поэтому проглядел Ваш вопрос. Спасибо Илье, что он указал на эту оплошность.

      К сожалению я не знаком с трудами И. Пригожина в достаточной степени хорошо, чтобы чувствовать себя удобно комментируя по вопросу о стреле времени.

      Вы спрашиваете: А вот является ли ситуация со шкатулками случайной по своей природе, или её следует считать детерминированной, но не полностью описанной...

      Мое отношение к подобного рода вопросам довольно четко изложено в моих комментариях к другой очень интересной заметке Ильи О случайных процессах:

      http://my-tribune.blogspot.com/2010/05/blog-post_28.html

      Здесь пожалуй уместно пояснить почему не следует говорить, что вероятность - это мера осведомленности. Такая формулировка невольно ассоциируется с вообще говоря неверным впечатлением, что бОльшая осведомленность о предмете объязательно ведет к бОльшей уверенности в справедливости вывода, который делается на основе этой осведомленности. Это легко продемонстрировать на простом примере. Представьте себе, что вы не знаете абсолютно ничего о монете за исключением того, что она имеет две стороны - орел и решка. Какова ваша вероятность того, что при первом броске монеты выпадет решка? Ответ очевиден: 1/2. Почему? Потому что у вас нет никаких оснований полагать, что решка имеет больше шансов, чем орел. Полная симметрия ИНФОРМАЦИИ, от которой никуда не денешься.

      Теперь представьте себе, что вам дали полную свободу узнать все что угодно вашей душе об этой монете - измеряйте, ощупывайте, пробуйте на зуб - все что хотите. И в результате всех ваших изысканий, допустим, вы не сумели обнаружить никакой ассиметрии. Какова теперь ваша вероятность того, что при первом броске выпадет решка? Ответ очевиден: 1/2. Почему? Потому что у вас нет никаких оснований полагать, что решка имеет больше шансов, чем орел. Опять полная симметрия ИНФОРМАЦИИ. То есть получается на первый взгляд парадоксальная ситуция: во втором случае мы располагаем гораздо большей информацией, которая (что очень важно отметить) имеет прямое отношение к делу, но это нисколько не увеличивает нашу уверенность в выпадении решки!

      Что же это получается - вся эта дополнительная информация, которую мы приобрели во втором случае, не имеет абсолютно никакого значения? Вот где возникает очень важное понятие стабильности оценки вероятности. Действительно, подумайте: как будет меняться ваша оценка вероятности выпадения решки при втором, третьем и т.д. бросках. В первом случае эта вероятность будет все время обновляться с учетом результатов предыдущих бросков, а во втором же случае вероятность, по вполне понятной причине, не будет вообще зависеть от результатов предыдущих бросков; здравый смысл подсказывает, что она должна оставаться равной 1/2.

      Вот почему правильнее говорить, что вероятность является функцией осведомленности, а не мерой осведомленности. Действительно, ведь набор имеющейся в наличии информации однозначно определяет вероятность (а это и есть определение понятия математической функции, которая вовсе не исключает возможности, что различные аргументы возможно будут имеет одинаковое значение функции). А слово мера имеет совсем другой смысл и совсем другую коннотацию.

      Удалить
  14. 1. $P = \sum_{i=0}^{n}p_i \cdot \frac{i}{n}$
    2. $Q = \frac {\sum_{i=0}^{n}p_i\frac{i\cdot(i-1)}{n\cdot{n-1}}} {\sum_{i=0}^{n}p_i\frac{i}{n}}
    3. P=Q, если p_n=1. Q>P, Если p_n=1-p_0<1. В этом случае P=p_n, Q=1.
    4. Если p_i = \frac {1}{n+1}, то P = 1/2, Q = 2/3. Откуда Q всегда больше P.

    ОтветитьУдалить
    Ответы
    1. Это было для случая если коробку с призом убирают. Если не убирают, то
      $Q=\frac{\sum_{i=0}^{n}p_i\frac{i\cdot(i-1)}{n^2} {\sum_{i=0}^{n}p_i\frac{i}{n}}$.
      3. Если p_n=1-p_0, то P=p_n, Q = (n-1)/n. Соответственно при p_n=(n-1)/n, Q=P, а при меньших значениях - Q>P.
      4. В этом случае получается Q=2/3*(n-1)/n. P=Q получается при n=4. При n>4 выполнено Q>P, при n=2,3 выполнено Q<P.

      Удалить
  15. Уважаемый id, в задаче сказано, что приз убирается, но пустая коробка возвращается. Надо было отметить, что Вы рассматриваете совершенно два новых варианта задачи:

    (1) Убирают и приз и коробку;
    (2) Возвращают и приз и коробку.

    Варианты очень поучительные, спасибо Вам за это. Но даже не вникая в логику Ваших расчетов, могу почти с уверенностью сказать, что Вы даете неправильные ответы в обоих случаях. Действительно, если p0=p1=p2=...=pN, то здравый смысл подсказывает, что в пределе когда количество шкатулок N стремится к бесконечности, Q должна стремиться к P, т.е. к 1/2. Проверьте пожалуйста Ваши расчеты.

    Мои ответы таковы:

    (1) Q = [(1р1+2р2+3р3+ ... + NрN)/(1-p0) - 1]/(N-1);

    (2) Q = (1р1+2р2+3р3+ ... + NрN)/(1-p0)/N.

    Попробуйте ответить на следующий очень интересный вопрос, который четко демонстрирует преимущество интерпретации вероятности как функции осведомленности. В случае (2), почему получается, что Q не равно P? Ведь мы вернули обратно коробку с призом и все опять перемешали, т.е. ФИЗИЧЕСКИ ничего ведь не изменилось по сравнению с началом игры.

    ОтветитьУдалить
    Ответы
    1. У меня все верно - во втором случае я возвращаю коробку без приза. Поэтому в формуле i\cdot(i-1) а не i^2.

      Вы ошиблись в формуле Байеса и поэтому у вас получился не правильный ответ. Подсказка: узнать что есть хотя бы один приз != открыть случайную коробку и увидеть приз.

      PS Мой ник - halyavin. Это просто авторизация через OpenID так забавно работает, а заводить аккаунт на блогере мне лень.

      Удалить
  16. Если шкатулка возвращается без приза, то, как многие уже правильно вычислили

    Q = [(1р1+2р2+3р3+ ... + NрN)/(1-p0) - 1]/N,

    что, как и положено, стремится к 1/2 при увеличении N, когда p0=p1=p2=...=pN (а не к 2/3 как у Вас).

    (1) Я не мог ошибиться в формуле, которую я не применял.
    (2) Я уверен, что при правильном применении формулы Байеса получится вышеприведенный результат.
    (3) Вы готовы, как говорят на диком Западе, положить деньги там, где находится Ваш рот? Если да, то сколько?
    (4) Прежде чем ответить на третий вопрос, рекомендую подстраховаться испытанием Вашего ответа на вшивость с помощью прямой Монте-Карло прогонки на компьютере. Не поленитесь проделать необходимую работу и не надейтесь на халяву, halyavin, поскольку это может вылететь в копеечку.

    И простите пожалуйста за невинный каламбур :)

    ОтветитьУдалить
    Ответы
    1. Многие уже вычислили Q *не правильно*. Просто эту ошибку легко допустить.

      Если вы попробуйте узнать и применить формулу Байеса (или сравнить мой результат с формулой Байеса), то вы увидите в чем здесь дело.

      Более того, чтобы проверить ответ с помощью Монте-Карло, нужно также знать или понимать формулу Байеса. Легче всего увидеть расхождение на случае p_0=1/4, p_1=1/2, p_2=1/4. Тогда все 4 варианта расположения приза в коробках равновероятны. Далее у нас есть 2 варианта выбора игрока и образуется 8 равновероятных вариантов. Из них игрок угадывает в 4 случаях. 2 случая когда приз один, и 2 случая когда приза два. Теперь нужно ограничиться только этими случаями, т.е. нормировать вероятность. Получается что с вероятностью 1/2 у нас на втором шаге не будет призов, а с вероятностью 1/2 будет один приз. Значит вероятность выигрыша равна 1/4.

      Теперь считаем по вашей формуле: ((p_1+2p_2)/(1-p_0)-1)/2=((1/2+1/2)/(1-1/4)-1)/2=1/6. А все потому, что вариант с двумя призами ошибочно посчитан один раз, а не два.

      halyavin

      Удалить
    2. Очень хорошо, давайте аккуратно проведем вычисления с помощью формулы Байеса для вашего конкретного примера. Чтобы вытянуть приз на втором этапе вам должно повезти и на первом и на втором этапе. Согласны? Значить Байес дает:

      (0.5 х 0 + 0.5 х 0 + 0.5 х 0.5 + 0.5 х 0.5)/3 = 1/6

      Как насчет пари, с Ильей в качестве верховного судьи? Если Вы сторонник демократии, я согласен предоставить дело суду с читателями в качестве присяжных заседателей.

      Удалить
    3. Вероятность каждого из 4 случаев, когда игрок угадывает на первом этапе - 1/8, поэтому и делить нужно на 4*1/8=1/2. Вероятность получится равной (1/8x0+1/8x0+1/8x0.5+1/8x0.5)/(1/2)=1/4. Откуда у вас берется 0.5 x и 3 мне не понятно.

      Если хотите увидеть, как это все получается формально, то посмотрите на главу extended form в английской википедии в статье про байеса. Если A_i - событие, что в коробках i призов, а B - событие вытягивания приза в первом раунде, то P(B|A_i)=i/n, P(A_i)=p_i. Получаем \sum_{i}P(B|A_i)P(A_i)=0/2*1/4+1/2*1/2+2/2*1/4=1/2. Новые вероятности A_i получаются следующими. P(A_0|B)=(0/2*1/4)/(1/2) = 0, P(A_1|B)=(1/2*1/2)/(1/2)=1/2, P(A_2|B)=(2/2*1/4)/(1/2)=1/2. Oтвет = 0/2*P(A_1|B)+1/2*P(A_2|B)=1/4.

      Удалить
    4. Пусть О означает - есть приз в шкатулке, Х - нет приза в шкатулке. Тогда, как Вы совершенно правильно отметили, имеем следующее распределение исходных вероятностей:

      OO (1/4)
      OX (1/4)
      XO (1/4)
      XX (1/4)

      Мы должны выбросить случай ОО в процессе нормировки (conditional probability), следовательно, после нормировки имеем :

      OX (1/3)
      XO (1/3)
      XX (1/3)

      Теперь должно быть ясно, как формула Байеса будет выглядет в этом конкретном примере для вероятности удачи на втором этапе:

      (1/3)(1/2)(0)+(1/3)(1/2)(0)+(1/3)(1)(1/2)= 1/6

      Удалить
  17. Вы используете conditional probability. Подумайте над тем, какое у вас условие (condition) и сравните с тем, что вы выкидываете. Между ними есть разница: узнать что есть хотя бы один приз != открыть случайную коробку и увидеть приз.

    halyavin

    ОтветитьУдалить
    Ответы
    1. Благодарю за настойчивость!
      Далеко не все готовы так последовательно отстаивать свою позицию. Особенно, если речь идёт не о вопросе жизни и смерти, а о какой-то несущественной задачке, не имеющей никакого отношения к народному хозяйству :)

      Удалить
  18. halyavin прав! Формула Байеса действительно дает в общем случае следующий ответ:

    Q = [2р2+6р3+ ... +N(N-1)рN]/(1р1+2р2+ ... +NрN)/N

    В частном случае {N=2, po=1/4, p1=1/2, p2=1/4} получается Q = 1/4, как halyavin и предсказывает.

    Если Байес на стороне halyavinа, мне следует понять почему интуиция так здорово подвела меня и подкорректировать ее соответствующим образом.

    Поспешишь - людей насмешишь. Большое спасибо halyavinу!

    ОтветитьУдалить
  19. Чтобы снять все сомнения, пожалуй стоит дать формальное и детальное изложение решения этой задачи на основе теоремы Байеса.

    Введем обозначения для следующих событий:

    Ai - по n шкатулкам разбросали i призов.
    B - на первом этапе игрок выбрал шкатулку с призом.
    С - на втором этапе, где количество призов уменьшилось на единицу, игроку опять повезло.

    По условию задачи P(Ai)=pi. Поскольку A0,A1,...,An - исчерпывающий набор независимых событий, то P(B) можно расписать следующим образом:

    P(B)=P[B(A0+A1+...+An)]=P(BA0)+P(BA1)+...+P(BAn)=P(A0)P(B|A0)+P(A1)P(B|A1)+...+P(An)P(B|An)=(1/n)p1+(2/n)p2+...+(n/n)pn=(1p1+2p2+...+npn)/n

    Согласно теореме Байеса, для каждого i имеем:

    P(Ai)P(B|Ai)=P(B)P(Ai|B) ⇒ P(Ai|B)=P(Ai)P(B|Ai)/P(B)=ipi/(1p1+2p2+...+npn).

    Искомая вероятность (повезло и на первом и на втором этапах) Q:

    Q=P(C|B)=P[C(A0+A1+...+An)|B]=P(CA0|B)+P(CA1|B)+...+P(CAn|B)=P(A0|B)P(C|A0B)+P(A1|B)P(C|A1B)+...+P(An|B)P(C|AnB).

    Мы уже вычислили P(Ai|B), а P(C|AiB)=(i-1)/n. После подстановки этих величин в предыдущее выражение для Q, имеем окончательно:

    Q=[2р2+6р3+ ... +n(n-1)рn]/(1р1+2р2+ ... +nрn)/n

    ОтветитьУдалить
    Ответы
    1. Анонимный22.01.2012, 12:47

      А как понять, почему интуитивное решение даёт совсем другой ответ Q=Sum(for i=1..N)pi*(i-1)/N/(1-p0)? Я никак не могу себе этого объяснить :-(

      Удалить
    2. Трудно объяснить, почему интуитивное решение даёт совсем другой ответ. Но не так трудно убедить себя, что этот ответ неправильный. Как? Надо провести эксперимент Монте-Карло в уме. Для этого, вопреки утверждению halyavinа, совсем не надо понимать смысл теоремы Байеса или даже знать как она работает.

      Рассмотрим тот же пример halyavinа: {N=2, po=1/4, p1=1/2, p2=1/4}, где подход Байеса дает Q = 1/4. Представьте себе, что мы раскладываем призы по двум шкатулкам согласно распределению вероятностей: po=1/4, p1=1/2, p2=1/4. Затем мы выбираем шкатулку случайно. Если попалась шкатулка без приза, то мы этот случай выбрасываем и начинаем опыт сначала. Если же попалась шкатулка с призом, то этот случай идет в общий счет (Y=Y+1) и мы продолжаем игру: убираем приз; возвращаем пустую шкатулку; перетасовываем шкатулки; и, наконец, делаем случайный выбор. Если на втором этапе нам повезло, то увеличиваем счет удач на единичку (Z=Z+1).

      Мы повторяем этот мысленный Монте-Карло эксперимент, скажем, 40 раз. Что у нас получится в результате? Раскладка призов по шкатулкам будет иметь приблизительно такой характер:

      OO - получим 10 раз,
      OX - получим 10 раз,
      XO - получим 10 раз,
      XX - получим 10 раз.

      Где О означает - приз в шкатулке, Х - нет приза в шкатулке. Все 10 случаев ОО будут, очевидно, выброшены и не пойдут в счет Y. Приблизительно половина из 10 случаев ОХ будут выброшены, а другая половина пойдет в счет Y, но ни одна из них не пойдет в счет Z по понятной причине. Приблизительно половина из 10 случаев ХО тоже будут выброшены, а другая половина пойдет в счет Y, но ни одна из них не пойдет в счет Z. Все 10 случаев ХХ будут сохранены и пойдут в счет Y, но только приблизительно половина из них пойдет в счет Z.

      Поэтому можно с уверенностью сказать, что реальный эксперимент Монте-Карло даст в итоге: Y≈20, Z≈5. Q≈Z/Y≈5/20=1/4. А Ваш интуитивный ответ для рассматриваемого случая дает Q=1/6, т.е. неправильный ответ.

      Удалить
    3. Артур, спасибо за хороший контр-пример. Он полезен для развеивания неправильно гипотезы. А в очередной заметке я предлагаю читателям сформулировать, где была допущена массовая ошибка, приводящая к неправильному Q (т.е. не только опровергнуть, но и понять, как мы ошиблись).
      Более того, в своё время мне удалось провести не очень сложные аккуратные рассуждения, давшие правильный ответ и без теоремы Байеса. Думаю, это полезное упражнение для развития интуиции и аккуратности при "логических рассуждениях" :)

      Удалить
  20. Парадокс Монте Хилла погуглите... на ю-тубе есть ролик...

    ОтветитьУдалить
  21. yuv-k,
    мы уже обсуждали в других заметках и парадокс Монти-Холла, и его интересное обобщение.
    В данной же заметке мы имеем дело с более сложной проблемой.

    ОтветитьУдалить
  22. Посчитал вероятности за 5 минут просто из интереса (не уверен, что правильно, не проверял). Получилось:
    P = (p_1 + 2 p_2 + ... + N p_N) / N
    Q = (2 p_2 + 2*3 p_3 + 3*4 p_4 + ... + N(N-1) p_N) / N(p_1 + 2 p_2 + ... + N p_N)
    На остальные вопросы отвечать лень, комментарии читать тоже (тех глазами читать не умею).
    Попробовал p_0 = p_1 = p_2 = p_3 = 1/4; N=3, получил P = 1/2; Q = 4/9, Q < P.
    Я тоже неправильно Q посчитал?

    ОтветитьУдалить
    Ответы
    1. А, да, естественно.
      Подставил другие значения, очевидно, Q может быть больше чем P.
      Однако это также интуитивно понятно, например:
      Вероятность того что в семи шкатулках будет 0 призов и 7 призов одинакова и равна 1/2. Тогда априорная вероятность вытащить с первого раза приз будет 1/2 (очевидно). Но апостериорная вероятность вытащить приз второй раз при условии что первый уже вытащили, будет равна 6/7, так как уже абсолютно точно известно что изначально все коробки были с призами.
      Естественно, вероятность находжения k призов в шкатулках меняется при поступлении данных (реализации случайной величины).
      Это достаточно очевидно.
      Кстати, когда читал задачу, на вопрос является ли Q всегда меньше P, ответил "не уверен".

      Удалить
    2. Да, формулы выглядят очень похоже.
      Если интересно, в следующей заметке мы продолжили обсуждение этой задачи.

      Удалить

Понравилась заметка? Подпишитесь на RSS-feed или email-рассылку.

Хотите поделиться ссылкой с другими? Добавьте в закладки:



Есть вопросы или предложения? Пишите письма на адрес mytribune АТ yandex.ru.

С уважением,
      Илья Весенний