25 авг. 2009 г.

Удивительное рядом

Сегодня в рубрике «Три чего-нибудь» будет три прекрасных и удивительных штуки:

1. Парадокс конвертов губит природную симметрию случая. Речь идёт не о методе четырёх конвертов Макса Крайнова, а о старой непонятной игре. Представьте, что Якубович предлагает вам выбрать один из двух одинаково выглядящих конвертов. При этом точно известно, что в одном из них денег в два раза больше, чем в другом. Вы пересчитали деньги в выбранном конверте - там ровно x рублей. Это значит, что во втором конверте x/2 или 2x (оба варианта равновероятны). Но ещё это означает, что если вы сейчас откажетесь от первого конверта, а возьмёте второй, то в среднем выиграете (x/2 + 2x)/2 = 5x/4, что больше x. То есть, очевидно, что надо выбирать второй конверт, чтобы выиграть больше. Естественно, интуиция сопротивляется. Но против логики не попрёшь :) Интересно, что есть более выгодные тактики, об этом как раз написано в статье (может показаться, что это всё чем-то похоже на парадокс Монти-Холла, но это совсем не он :)

Дополнение: вообще-то в статье хоть наукообразный и правдоподобный, но бред (я надеюсь, что авторы просто пошутили). В комментариях проблема коротко объяснена (а в следующей заметке подробно разобрана).

2 Медвежата на Аляске. Загляните в эту заметку, чтобы потом прочитать ещё несколько других на этом сайте. Забавно, что в интернете можно искать рецепт одного блюда, чтобы уточнить некоторые детали, а найти дополнительно увлекательные описания прогулок по красивейшим местам. Очень рекомендую прочитать подписи к фотографиям - из них становится понятно, какие интересные отношения между медведями в заповеднике, как они охотятся, как взаимодействуют друг с другом и другими существами. Снимки очень качественные (ребята близко подходили к медведям), комментарии весёлые. Очень рекомендую!

3. Волейбол - это захватывающая игра! Заметьте, как дисциплинированно отрабатывают игроки свои роли на площадке, как стараются предельно эффективно сыграть каждый мяч. И это даёт результаты! Даже если вы не играете в волейбол, посмотрите этот ролик - он красиво и ярко рассказывает многое об этой удивительной игре:

(спасибо Serg за ссылку на видео!)
Играйте в волейбол!

Хорошей недели!

19 комментариев:

  1. Илья, что-то меня после имитационного моделирования терзают смутные сомнения по поводу двух конвертов.

    Почему-то неявно предполагается, что случайным образом определяется сумма в первом конверте, который мы открываем, а сумма во втором конверте от неё зависит. Если это так, то действительно выгоднее выбрать второй конверт, так как и максимальная величина суммы (в случае, если "бюджет" приза не бесконечен) и её матожидание в этом конверте будет больше.

    Однако, на самом деле-то происходит еще одно случайное событие - выбор конверта, который мы открываем. При моделировании по этому сценарию получаем, что выигрыш от того, выбираем мы первый или второй конверт, не зависит.

    Еще более интересный эффект будет, если максимальную сумму не ограничивать - в этом случае даже в первом случае стратегия смены конвертов выигрыша не даст.

    Код мини-модельки на питоне внизу - комментарии приветствуются.

    import random

    MIN_SUM = 1
    MAX_SUM = 1000000
    NUM_TRIES = 10000

    # First

    strategy1 = 0
    strategy2 = 0

    for x in range(0, NUM_TRIES):
    first = random.randint(MIN_SUM, MAX_SUM)
    second = random.choice([first / 2, first * 2])

    strategy1 += first
    strategy2 += second

    print strategy1
    print strategy2

    # Second

    strategy1 = 0
    strategy2 = 0

    for x in range(0, NUM_TRIES):
    a = random.randint(MIN_SUM, MAX_SUM)
    b = random.choice([a / 2, a * 2])
    (first, second) = random.choice([(a,b), (b,a)])
    strategy1 += first
    strategy2 += second

    print strategy1
    print strategy2

    ОтветитьУдалить
  2. bkonst, спасибо за начало конструктивного диалога об этом парадоксе. Я думаю, надо будет когда-нибудь написать внятное объяснение, где обман :)
    А пока давайте попробуем пообсуждать в комментариях, до какой путаницы можно дойти, ведя беседу о вероятностях событий. Возможно, здесь в комментах и удастся разобраться, попробуем.

    ОтветитьУдалить
  3. Ну, начнем с того, что в исходных данных не сказано ничего про то, как выбирается сумма в конверте. Обычно в таком случае мы используем какие-то разумные значения. В данном случае "разумным" можно посчитать то, что сумма в первом ("базовом") конверте будет
    1) неотрицательной (игрока не штрафуют)
    2) ограниченной сверху величиной MAX (сумма приза не может быть сколь угодно большой)

    Так вот, открывая конверт, мы можем увидеть в нем сумму S \in [0, 2*MAX] (в зависимости от того, какой конверт мы выбрали). В силу условия (2) условная вероятность того, что в оставшемся конверте лежит вдвое большая сумма, непостоянна:
    P(S) = 0.5 при S <= MAX и
    P(S) = 0 при S > MAX

    что и губит стратегию "всегда выбирай другой конверт".

    ОтветитьУдалить
  4. Меня вообще удивляет, что такое опубликовалось на мембране. Начиная со стиля изложения:

    перспективный подход к 80-летней загадке, объяснение которой может иметь последствия для массы теоретических и прикладных областей
    Ага, 80-летний банальный математический фокус сейчас вдруг станет очень важным начнёт резко применяться.

    На разрешение данного парадокса не один раз претендовали различные учёные
    И, конечно же, у них ничего внятного не получилось. Слишком уж задача сложная.

    свыше 20 миллионов компьютерных симуляций, проведённых Макдоннелом и Эбботтом, показали
    20 миллионов?!?! огого! Ну тогда конечно же они правы.

    Ну ладно с ним со стилем, но ведь и сути никакой нет. Начинается всё с ошибочного утверждения "Таким образом, теория говорит, всегда выгодно менять первоначальный свой выбор", а затем, оказывается, существуют и ещё более гениальные стратегии!

    Но ведь ясно, что ни при каком раскладе теория не может такого сказать, и конечно же, это "противоречит интуиции", просто потому что это неверно (собственно, неверно с момента "Стало быть, в другом конверте лежат либо $5, либо $20 с вероятностью 50 х 50" - это ошибочное утверждение).

    В случае, когда конверты симметричны, нет никакой разницы, будем ли мы выбирать первый попавшийся конверт, или же не его. По определению симметрии. И открытие конверта никак эту симметрию не разрушает. И не нужно тут про квантовую механику, ага.

    Знание суммы в первом конверте, собственно, тоже ни на что не влияет до тех пор, пока её не с чем сравнивать.

    А вот если, например, мы знаем максимальную сумму, которая может быть в конверте, то нам уже есть с чем сравнивать. И, как верно отметил bkonst, если в первом конверте больше, чем половина этой суммы, то в другом не может быть больше.

    В общем, если у нас есть какой-то другой параметр для сравнения, будь то оценка максимального бюджета, параметры распределения вероятности, какие-то скрытые параметры, или что-либо ещё, то оптимальная стратегия вполне может существовать. Вот только что в этом такого научного, удивительного и парадоксального?

    ОтветитьУдалить
  5. bkonst, Ваш второй комментарий почти всё расставляет на места!

    7vies, я тоже очень удивился, что обычную ловушку для тех, кто давно или не чётко учил теорию вероятности, на вроде бы приличном сайте так красиво расписали. Поэтому я на всякий случай поставил многозначительный смайлик после комментария к этой статье.

    Недавно мы разбирали доказательство того, что все лошади лиловые, поэтому к огромной мощи математики читатели уже привыкли :) Собственно, почти всё уже понятно из этих комментариев. Но, вероятно, я всё же напишу отдельный разбор "парадокса".

    ОтветитьУдалить
  6. Анонимный26.08.2009, 14:44

    >>(собственно, неверно с момента "Стало быть, в другом конверте лежат либо $5, либо $20 с вероятностью 50 х 50" - это ошибочное утверждение).

    напомните плохо учившимся, почему?:)

    ОтветитьУдалить
  7. Уважаемый аноним, дело в том, что у нас нет оснований, чтобы утверждать, что вероятность $5 и $20 одинаковы. Интуиция почему-то хочет этого, но реальной причины так думать нет.
    А раз нет этого пункта, то и всё дальнейшее рассуждение теряет смысл. Скоро об этом будет отдельная заметка.

    ОтветитьУдалить
  8. Некоторые из упомянутых здесь моментов рассмотрены авторами статьи примерно в середине текста.

    ОтветитьУдалить
  9. Илья Весенний, если не равны, то какая вероятность вытянуть двадцатку?

    ОтветитьУдалить
  10. Spellman, в следующей заметке мы подробно разобрали этот парадокс.

    Если коротко, то ситуация такая: данных в задаче недостаточно, чтобы определить вероятности. Но человеческая интуиция подсказывает, что вероятности равны. И из этого неверного предположения люди доказывают что угодно (используя ложное утверждение, можно доказать что угодно).

    Ответ на Ваш вопрос такой: невозможно сказать, какая вероятность вытянуть двадцатку, потому что мы недостаточно знаем о ситуации. А раз так, то нельзя и опираться на равновероятность 5 и 20 в своих выкладках.

    ОтветитьУдалить
  11. Анонимный23.03.2011, 11:40

    На самом деле здесь ситуация другая и Вы Илья создали кашу в голове у Ваших читателей. Задача имеет совершенно четкий ответ.

    Мы имеем одну единственную выборку (это условие задачи), при которой в конкретных конвертах лежат совершенно конкретные суммы, допустим 100 и 200 руб. Абсолютно РАВНОВЕРОЯТНО нахождение 100\200 руб в первом\втором конверте и во втором\первом конверте. Это по условию задачи, что конверты одинаковые. Вскрытие первого конверта не добавляет нам ровно никакой информации, поскольку мы не знаем о суммах ничего, кроме Якубовича, поэтому на результат не влияет. Об этом убедительно рассказал уважаемый chester, цитирую:

    Начало цитаты.
    К моменту выбора конверты запечатаны, сумма денег фиксирована. Выбор идет между х и 2х. Если количество денег в изначально выбранном конверте - обозначить за "А", а нашу стратегию - факт смены конверта - за "Б", то возможны следующие варианты
    1) А = х, Б = true; Выигрыш - 2х;
    2) А = х, Б = false; Выигрыш - х;
    3) А = 2х, Б = true; Выигрыш - х;
    4) А = 2х, Б = false; Выигрыш - 2х;

    Вероятность исходов A = x и А = 2х одинакова и равна 1/2. Получаем, что при любом Б ожидаемый выигрыш равен 1/2*х + 1/2*2х = 1.5х.
    Конец цитаты.

    Матожидание выигрыша - 150 руб. Для подтверждения, если провести исследование (хотя бы умозрительное) и дать эти конверты на пробу одной тысяче человек, то пятьсот человек выиграют по 100 руб и пятьсот человек выиграют по 200 руб.

    Поэтому правильный ответ поставленной задачи - выбирай любой конверт и не смотри на результаты вскрытия первого конверта - матожидание выигрыша равно среднеарифметической из сумм конвертов.




    Ваша ошибка, уважаемый Илья, заключается в том, что Вы неявно изменили условие исходной задачи, предположив, что выборка не одна, а несколько, тем самым перешагнув через теорию вероятности и наступив на теорию матстатистики. Теория же матстатистики оперирует исходными данными - гипотезами о распределении. В условии этой конкретной задачи нет ничего о распределении вероятностей. Вы сошли с тервера, но так и не дошли матстата, поскольку матстату здесь делать нечего - нет гипотезы о распределении. Вы совершенно справедливо сделали вывод о том что матстат здесь не дает никакого ответа. Вы не тот матаппарат применили.



    Ошибка в рассуждениях авторов задачи заключается в том, что они неправомочно отождествили два разных понятия.
    Первое - вероятность того что среди двух конвертов большая сумма находится во втором конверте, а не в первом.
    Второе - вероятность того что среди двух сумм большая сумма находится во втором конверте, а не в меньшая.

    Первая вероятность всегда по определению равна 50% для любой конкретной единичной выборки.
    Вторая вероятность зависит от гипотезы о распределении.

    Еще раз повторяю, ошибка Ильи в том что он применил неподходящий матаппарат - матстатистику, совершенно справедливо сделав вывод что этот аппарат здесь неприменим (неподходящий потому что нет гипотезы) и не получив в результате никакого ответа.
    Ошибка авторов в том что они применили вполне подходящий матаппарат - матстатистику совершенно несправедливо сделав предположение о равномерном распределении сумм (такого не бывает на бесконечном множестве, да и вообще бесконечность неприменима к матстату) и получив в результате неверный ответ.
    Правильный ответ поставленной задачи - выбирай любой конверт и не прогадаешь.

    ОтветитьУдалить
  12. Илья Весенний сказал:

    Уважаемый аноним, дело в том, что у нас нет оснований, чтобы утверждать, что вероятность $5 и $20 одинаковы.

    Согласен с этим утверждением.

    Spellman спрашивает:

    Илья Весенний, если не равны, то какая вероятность вытянуть двадцатку?

    Наконец-то кто-то четко и прямо поставил вопрос ребром! Суть этой проблемы заключается в правильном ответе именно на этот фундаментальный вопрос. Этот вопрос невозможно разрешить в рамках классической теории вероятности по той простой причине, что такого рода вопросы вообще не являются предметом математической теории вероятности Колмогорова.

    В чем же особенность этого вопроса? Теория вероятности Колмогорова - эта математическая теория, построенная на аксиоматической основе. В частности, в ней постулируется существование какого-то множества равновероятных, атомарных можно сказать, событий (или точек на языке теории мер). То есть дается затравка, чтобы можно было начать расчет вероятности всех остальных, более сложных событий, которые в конечном итоге сводятся к некоторым комбинациям атомарных событий. Классическая теория вероятности не только не знает другого способа затравки, но даже и не ставит своей задачей изобретать другие принципы затравки.

    Изобретение новых принципов подобного рода - является открытой проблемой логики. Главное и единственное требование к таким принципам является, что не удивительно, отсутствие логического противоречия. Такова точка зрения Jaynes, кто является автором двух таких принципов - принципа максимума энтропии и принципа инвариантности определенных групп преобразований.

    Илья Весенний отвечает но вопрос Spellman:

    Ответ на Ваш вопрос такой: невозможно сказать, какая вероятность вытянуть двадцатку, потому что мы недостаточно знаем о ситуации.

    Так ли? Продолжение следует ...

    ОтветитьУдалить
  13. Выше я высказал возмутительное утверждение, которое почти наверняка вызовет удивленное неприятие и протест со стороны читателя: Вопрос Spellman невозможно разрешить в рамках классической теории вероятности по той простой причине, что такого рода вопросы вообще не являются предметом математической теории вероятности Колмогорова.

    Перечитав объяснение, которое последовало за этим утверждением, я сам остался неудовлетворенным своим же разъяснением. Поэтому, прежде чем продолжить обсуждение проблемы двух конвертов, хочу вернуться к тому возмутительному утверждению и попытаться еще раз объясниться.

    Классическая теория вероятности (под этим я подразумеваю ту теорию, которая сегодня преподается в школе) знает и имеет дело исключительно с одним типом задач, а именно, с ВЫЧИСЛЕНИЕМ вероятности чего-либо. Но чтобы ВЫЧИСЛИТЬ вероятность чего-то, объязательно нужно располагать значением вероятности чего-то другого. Откуда берется это исходная вероятность, с которой мы начинаем танцевать? Она либо (1) просто задается в условии задачи как некое распределение вероятности, которое якобы получено в результате каких-то повторных экспериментов, либо (2) в задаче, явно или неявно, подразумевается, что исходное распределение вероятности является однородным в соответствии с Принципом Неразличимости (Principe of Indifference).

    Но есть другой очень важный тип задач, который вообще не обсуждается в классической теории вероятности и даже не считается предметом этой теории: НАЗНАЧЕНИЕ исходных, сырмяжных так сказать, вероятностей (Ignorance Priors). Классическая теория знает только один принцип для НАЗНАЧЕНИЯ (или ОПРЕДЕЛЕНИЯ, если хотите) сырмяжных вероятностей - Принцип Неразличимости (Principe of Indifference), который просто по определению приводит к равномерному распределению сырмяжной вероятности среди всех возможных исходов.

    Важность проблемы двух конвертов, на мой взгляд, заключается в том, что она четко демонстрирует неадекватность классической теории для решения второго типа задач, которые, с точки зрения теорией вероятности как логики, рассматриваются и считаются как раз наиболее важными для приложений не только в науке, но жизни в целом, ибо логика это основа бытия человека, без которой не обходится ни один человек буквально ни на секунду в течение всей своей жизни.

    Держитесь за свои кресла, полет продолжается ...

    ОтветитьУдалить
  14. Вернемся теперь к самой проблеме двух конвертов. Обратите внимание: мы знаем, что бОльшая сумма в два раза больше чем меньшая, но мы ничего не знаем о процедуре, согласно которой генерируется меньшая сумма. У нас даже нет никаких оснований предполагать, что эта процедура является независимой выборкой, другими словами, что эта процедура основана на каком-то фиксированном распределении вероятностей (prior probability distribution, или сокращенно prior). Читатель может недоумевать: а как же иначе, конечно процедура выбора меньшей суммы основана на каком-то определенном распределении вероятности, мы просто не знаем какое именно распределение используется. Совсем не объязательно. Эта процедура, например, может быть основана на цепи Маркова, т.е. выбор суммы в очередном раунде игры не является независимой выборкой (в соответствии с некоторым, хотя неизвестным, но все же фиксированным prior), а увязана по какому-то закону с выбором суммы в предыдущем раунде. Этот факт является очень важным, и за все 80 лет обсуждения этого парадокса, я нигде не видел упоминания этого фактора.

    Если бы мы знали prior, то ответить на вопрос Spellman не составило бы малейшего труда - достаточно было бы грамотно применить теорему Байеса. Но мы не только не знаем prior, у нас даже нет малейшего основания предполагать, что этот prior вообще существует! Я думаю именно это имел в виду Илья, когда он сказал: невозможно сказать, какая вероятность вытянуть двадцатку, потому что мы недостаточно знаем о ситуации.

    Другими словами, Илья видит эту проблему как обычную проблему классической теории вероятности на ВЫЧИСЛЕНИЕ вероятности. И в этом смысле он прав когда заявляет, что мы не можем ВЫЧИСЛИТЬ эту вероятность.

    Но в ситуации, когда у нас нет даже оснований предполагать, что prior хотя бы существует, задача выходит за рамки классической теории вероятности и переходит в область теории вероятности как логики. Теперь распределение вероятности между двумя возможными значениями 5 и 20 (posterior) перестает быть проблемой на ВЫЧИСЛЕНИЕ вероятности и переходит в разряд проблем на ВЫБОР вероятности; и этот выбор должен быть таким, который не ведет к логическому противоречию. Т.е. распределение вероятности между двумя возможными значениями (5 и 20) уже само приобретает роль prior.

    Как мы уже отмечали, классическая теория знает лишь один способ выбора prior - принцип неразличимости. Но как все уже осознали, применение этого принципа в данном случае, т.е. выбор р(5)=р(20)=1/2, приводит к явному логическому противоречию.

    Какой же выход из этого тупика? Очень простой - для выбора prior надо применить принцип, который не ведет к логическому противоречию. Что это за принцип? Принцип максимума энтропии.

    Об этом мы поговорим в следующий раз.

    ОтветитьУдалить
  15. Так в чем же состоит принцип энтропии, и как он работает? Ответить на этот вопрос легче всего с помощью разбора конкретной задачи. Пример, который мы рассмотрим, поможет нам заодно продемонстрировать наглядно, и буквально прочувствовать, разницу между классической теорией вероятности, с одной стороны, и теорией вероятности как отражения логики, с другой.

    Представьте себе, что у нас есть обычная кость в форме куба с пометками 1,2,3,4,5,6 на шести ее сторонах. Допустим, что у нас есть также информация, что куб изготовлен из очень неравномерного по плотности материала, так что центр инерции куба очень сильно смещен. Какова вероятность выпадения шестерки при первом же броске кости?

    Классическая (частотная) теория вероятности и логическая теория вероятности видят этот вопрос, и отвечают на него, совершенно по разному. Классическая теория даже не знает как приступить к решению этой задачи. Все что она может сказать: Дорогой, Вам следует бросить кость N раз, где N - очень большое число, посчитать сколько раз выпадет 6, и затем разделить полученное число на N. Но это не устраивает нас по понятной причине - такой ответ на наш вопрос звучит почти как издевательство, в лучшем случае, или как насмешка, в худшем. Логическая же теория дает прямой, честный и простой ответ, с которым здравый смысл соглашается мгновенно: р=1/6, потому что имеющаяся у нас в наличии информация не дает абсолютно никаких оснований полагать, что вероятность выпадения 6 выше или ниже вероятности любого другого из возможных исходов.

    Теперь представьте себе, что, шутки ради, мы все-таки решили последовать совету "частотников" и попросили Государственный Комитет по Защите Статистики и Прав Человека провести 1000 честных бросков нашей кости. Но бюрократы из Госкомитета, будучи бюрократами, забыли посчитать сколько раз выпала 6 и вместо этого просто сложили числа, которые выпали в каждом из 1000 бросков, и сообщают нам получившуюся в результате сумму - 4500. Вопрос: с учетом только-что поступившей свежей информации из Госкомитета правозащитников, какова вероятность выпадения 6 при следующем броске кости? В качестве ответа на этот вопрос из стана "частотников" поступила нешуточная угроза: Мы занимаемся объективной наукой здесь, а не субъективным гаданием; делайте как мы сказали, или мы подадим на вас в международный суд по нашим правам. Между тем, "логики" мгновенно смекнули, что они получили ценную информацию, и, следуя своей, раздражающей всех, привычке мыслить логически, немедленно приступили к делу. Если бы наша кость была абсолютно симметричной - вопрошали они самих себя - какое число мы бы получили из Госкомитета? Скорее всего мы бы получили число, которое довольно близко к мат ожиданию идеальной кости - решили они - т.е. близко к 1000(1+2+3+4+5+6)/6 = 3500. Но мы получили 4500, что отличается от 3500 более чем на 28%, что похоже подтверждает изначальную информацию о неидеальности кости. Хорошо, что дальше? Давайте обозначим степень нашей веры в выпадение 1 через р1, 2 - через р2, 3 - через р3, и т.д. Тогда, естесственно, должно быть р1+р2+р3+р4+р5+р6=1, и, кроме того, разумно ожидать, что 4500/1000 должна в пределах нескольких процентов совпадать с мат ожиданием реальной кости: 1*р1+2*р2+3*р3+4*р4+5*р5+6*р6=4.5.

    Продолжение следует ...

    ОтветитьУдалить
  16. Таким образом, мы имеем два уравнения с 6-тью неизвестными:

    р1+р2+р3+р4+р5+р6=1
    1*р1+2*р2+3*р3+4*р4+5*р5+6*р6=4.5

    Все это очень хорошо, но слишком уж много решений, удовлетворяющих этой системе уравнений. Какое именно решение из этого множества является самым "хорошим"? Например, чем плох решение: р1=0.3; р2=р3=р4=р5=0; р6=0.7 ? Очень уж оно, как бы правильнее выразиться, как бы "несправедливое" что-ли по отношению к р2, р3, р4 и р5. Это похоже на расизм - было мнение многих. Конечно, ничего неестественного в расизме нет, но должны быть хоть какие-то свидетельства, что одно предпочтительнее другого - отозвались другие. А если таких свидетельств нет, то честность суждения вынуждает нас, объективных судей, выбрать то решение, которое больше всего соответствует отсутствию таких свидетельств. Другими словами, кажется разумным остановить наш выбор на том решении, которое в максимальной степени выравнивает искомые вероятности р1, р2, р3, р4, р5 и р6. Очень хорошо, но как именно надо мерить степень близости этих величин друг другу? Конечно, более идеальной близости не бывает, чем когда все они просто совпадают. Но это противоречит той информации, которой мы располагаем; формально это выражено тем фактом, что допуская р1=р2=р3=р4=р5=р6, мы никак не можем удовлетворить нашим двум уравнениям - это было бы совершенно неоправданной и необузданной уравниловкой.

    У меня идея, воскликнул один. Давайте выберем в качестве меры близости искомых вероятностей следующее выражение р1*р1+р2*р2+р3*р3+р4*р4+р5*р5+р6*р6 и выбрать то решение, которое доставляет минимальное значение этому функционалу. Хорошая идея, - сказал другой - кажется Гаусс пользовался чем-то вроде этого для анализа ошибок астрономических измерений, а он был не дурак. Да, но ведь можно предложить и другие, не менее разумные, меры. Как нам выбрать самую лучшую из всех хороших мер? Все сошлись на том, что объязательным требованием к мере должно быть требование логической непротиворечивости. После этого они стали испытывать на вшивость каждую из предложенных мер. Оказалось, что все они вшивые за исключением одной единственной меры, которую предложил Клод Шэннон: -p1*ln(p1)-p2*ln(p2)-p3*ln(p3)-p4*ln(p4)-p5*ln(p5)-p6*ln(p6). Причем эту величину, которую назвали энтропией информации, следует максимизировать, а не минимизировать, чтобы получить максимально возможное сближение вероятностей, не нарушая при этом наложенные вышеприведенными двумя уравнениями ограничения.

    Продолжение следует ...

    ОтветитьУдалить
  17. Теперь проблему двух конвертов сможет решить любой школьник владеющий математической техникой на уровне Эйнштейна, кто, как известно, звезд с неба не хватал в области самой точной из наук, но был непревзойденным мастером подбирать плохо лежащие алмазы на земле.

    Вы открыли свой конверт и увидели 10, чему равны вероятности 5 и 20 в другом конверте? Обозначим искомые вероятности через р1 и р2. Тогда

    р1 + р2 = 1
    (5-10)*р1 + (20-10)*р2 = 0

    где второе уравнение есть математическое выражение простого и логически неизбежного вывода, что простой тасовкой конвертов невозможно разбогатеть.

    Соответствующая энтропия: -p1*ln(p1) - p2*ln(p2) .

    Решение: р1 = 2/3, р2 = 1/3. Следует отметить, что нам даже не пришлось максимизировать энтропию в чисто техническом плане. Задача оказалась вырожденной в том смысле, что логические ограничения, наложенные на две искомые неизвестные, оказались достаточными для решения задачи, исключая тем самым нужду в максимизации энтропии.

    Чтобы у вас не сложилось ложного впечатления, что я вас надул, предлагаю вашему вниманию другой вариант этой задачи - проблему трех конвертов.

    Даны запечатанные конверты с суммами в пропорции 1:2:4. Вы открываете любой конверт на выбор и обнаруживаете, что там лежит 20. Вы, по желанию, можете обменять свой конверт на любой из двух других. Ясно, что набор всех возможных сумм в конверте после обмена исчерпывается списком: 5, 10, 40, 80. Найти вероятность каждого из этих 4-х событий.

    Обозначим искомые вероятности через р1, р2, р3 и р4. Тогда

    р1 + р2 + р3 + р4 = 1
    (5-20)*р1 + (10-20)*р2 + (40-20)*р3 + (80-20)*р4 = 0

    где второе уравнение есть математическое выражение простого и логически неизбежного вывода, что простой тасовкой даже трех конвертов невозможно разбогатеть.

    Соответствующая энтропия: -p1*ln(p1) - p2*ln(p2) - p3*ln(p3) - p4*ln(p4). Теперь нам не избежать необходимости максимизации энтропии. Предлагаю читателям добить эту проблему.

    Конец фильма. Этот фильм не был снят на пленке Шосткинского комбината. Спасибо всем за внимание.

    ОтветитьУдалить
  18. Arthur Baraov,
    спасибо за содержательный текст. Жаль, что здесь его увидят немногие (комментарии к позапрошлогодним заметками читают не очень часто).
    Мне кажется, данный текст имеет смысл обсудить в отдельной заметке в следующем году (для этого его придётся минимальным образом подредактировать). Как Вы смотрите на эту идею?

    ОтветитьУдалить
  19. Илья, я думаю, что это хорошая идея. Очень нелегко убедить людей, особенно тех кто прочно освоил классическую теорию вероятности, что есть другая, гораздо более содержательная интерпретация понятия вероятности. Проблема двух конвертов является очень популярной как среди неспециалистов, так и среди знатоков.

    Поэтому есть некоторая надежда, что рассмотрение именно этой задачи с альтернативной точки зрения сможет как-то "разрубить лед".

    ОтветитьУдалить

Понравилась заметка? Подпишитесь на RSS-feed или email-рассылку.

Хотите поделиться ссылкой с другими? Добавьте в закладки:



Есть вопросы или предложения? Пишите письма на адрес mytribune АТ yandex.ru.

С уважением,
      Илья Весенний