Маловероятное событие

24 июн. 2012 г.

Маловероятное событие

Добрый день!

Можно потратить много денег, чтобы показать мне Филиппа Киркорова на лошади, поющего песню Сергея Шнурова «Ленинград» (вероятность того, что я окажусь в кафе именно тогда, когда местный телевизор исполнит это безумие, крайне мала, но ОНИ воспользовались своим шансом). А можно с весьма скромным бюджетом и совсем без лошади создать весёлый и просветительский клип «Грибок стопы» (угадайте, о чём), самый популярный комментарий к которому «I really do like this music, even don't knowing the text».

Сравнивать вероятности этих двух событий странно (особенно, когда мы знаем, что оба они уже благополучно произошли). Поэтому давайте сразу перейдём к делу. А дело у нас такое:

Несмотря на то, что мудрецы уже не раз демонстрировали не только преданность султану, но и незаурядную смекалку, султан решил устроить им еще одно испытание...

Стоп! Мы же не сравнили средний возраст нашей футбольной сборной, а также зарплату её тренера, с аналогичными характеристиками конкурентов! Гм... Ну не сравнили, ничего страшного. Может их всех вообще нет и не было никогда. Вернёмся лучше к задачке.

Все 100 мудрецов будут в этом испытании выстроены в колонну (каждый видит тех и только тех, кто стоит перед ним), и на головы им будут надеты шляпы одного из k>0 цветов (цвета шляп выбираются независимо и случайным образом). Каждый из мудрецов в колонне, начиная с последнего, должен будет либо назвать цвет своей шляпы, либо сказать «пас».

Мудрецы считаются прошедшими тест, если хотя бы один из них назовёт цвет верно и не будет никого, кто назвал цвет неверно.

Вопрос: как должны договориться мудрецы между собой до испытания, чтобы максимизировать вероятность успеха? И какова эта вероятность? Естественно, нельзя ориентироваться ни на какие дополнительные данные (высота голоса ранее ответивших, интервал времени перед ответом и т.д.), решаем честно :)

Для случая k=1 всё достаточно просто: если известно, что шляпы бывают только одного цвета, то именно его надо называть. С вероятностью 100% ответ будет правильным, поэтому мудрецы пройдут тест. Остаётся найти решение для случая k>1. Будьте осторожны, читая источник задачки, так как там в комментариях уже всё подсказано.

Чем мне нравится эта задача? А тем, что кажется, что она не имеет разумного решения. Судите сами: первый отвечающий (который видит перед собой 99 шляп) ничего не знает о цвете своей шляпы. Поэтому он, не имея права назвать какой-то цвет (если назовёт, то с вероятностью 1-1/k все проиграют), вынужден сказать «пас». Но у второго совершенно такая же ситуация: он видит перед собой 98 шляп, он заранее знал, что первый скажет «пас», поэтому он тоже вынужден говорить «пас». И так далее. Возникает иллюзия, что выиграть невозможно. И тем интереснее догадаться, как же действовать мудрецам.

И ещё одна мысль на сегодня: раньше, объясняя метод математической индукции, я часто показывал задачку о триминошках (и её изящное решение). Обычно такого типа задачка гораздо лучше проясняет ситуацию для ученика. Во всяком случае, это всё куда нагляднее, чем стандартные задачки на делимость (главное, не слишком сбить с толку задачкой о лошадях). Если вам близка эта тема, то рекомендую заметку про Ханойскую башню (там в комментариях полезное дополнение к основному тексту).

Ладно, желаю вам получить удовольствие от процесса решения задачки про мудрецов. А я пока продолжу заканчивать разгребать последствия серии маловероятных независимых событий, приведшей аж к трёхнедельному перерыву в выпуске новых заметок. То, что нас не убивает, делает нас предусмотрительнее.

Хорошего дня!

55 комментариев:

Анонимный24.06.2012, 14:19
Здравствуйте. Есть вопрос по условию: мудрецы заранее знают k, и заранее могут договориться о стратегии?
ОтветитьУдалить
Ответы
Анонимный24.06.2012, 15:35
Читал о задаче в «Астровитянке». Там k=2.
«— Нашла, нашла! Смотри — присваиваем красному колпаку значение единицы, а синему — двойки. Последний мудрец смотрит на колпаки впереди стоящих товарищей по несчастью и складывает все эти цифры. Получает число — чётное или нечётное. Если чётное — он отвечает на вопрос палача «синий», если нечётное — «красный». Ему может повезти, и этот цвет совпадёт с его колпаком, тогда он останется жив. Когда палач переходит к следующему мудрецу, тот уже знает ответ первого, подсчитывает сумму цифр по передним колпакам и если получает число той же чётности, то это означает, что его колпак — синий. Если чётность чисел не совпадает, то его колпак — красный. Так поступает каждый мудрец — зная ответ сзади стоящего и видя колпаки впереди стоящих, он вычисляет цвет своего колпака»
ОтветитьУдалить
Ответы
LisandreL24.06.2012, 16:00
Если k и сами цвета известны и каждого цвета не менее 1 шапки, то можно действовать так:
Первый из отвечающих, кто видит не все цвета называет отсутствующий цвет, остальные пасуют.
Цвет он назовёт верный, так как до него все пасовали, значит видели все цвета, а раз он видит не все, значит недостающий у него на голове.
После верного ответа вполне логично молчать (пасовать) чтобы всё не испортить.
ОтветитьУдалить
Ответы
Анонимный24.06.2012, 19:21
Для к=2 мудрецы пасуют пока перед каким-то не останутся только колпаки цвета(одного цвета пусть он будет 1) 1. Он объявляет 2. Если бы на нем был 1 предыдущий назвал бы 2. Если был пас значит предыдущий видел 2 разных цвета, а он видит только один значит второй цвект на нем.
Последующие пасуют чтобы ничего не испортить.

Для трех цветов тоже самое но пасуют только те кто видит все три цвета. Кто видит два называет третий.
ОтветитьУдалить
Ответы
asd24.06.2012, 19:23
Если вижу первый цвет, пасую, иначе называю первый цвет. Выигрываем тогда и только тогда, когда у кого-то есть первый цвет, то есть с вероятностью 1-((k-1)/k)^n. Не знаю, можно ли лучше, но здорово, что вообще можно лучше 1/k.
ОтветитьУдалить
Ответы
iLych24.06.2012, 21:49
Первое что приходит в голову - вести бинарную функцию от параметров A1, A2,..., AK, где Ai - это количество шляп i-ого цвета, которые видит перед собой мудрец. Если результат функции 0, то нужно говорить "пас", иначе - назвать цвет. При этом если очередь дошла до мудреца, у которого функция даёт 1 - он может сделать вывод: если на единицу увеличить параметр, соответствующий цвету его собственной шляпы, то функция даст 0, т.к. предыдущий сказал "пас". Если таких цветов больше одного - он говорит "пас", но надеемся, что рано или поздно найдётся мудрец, для которого вывод насчёт цвета однозначен, засчёт использованя того факта, что для предыдущего он был неоднозначен... надеюсь что-то понятно из такого объяснения.

В качестве функции можно использовать например F(...) = (A1*A2*A3*...*AK == 0). Иначе говоря: 0 - если перед мудрецом видны шляпы всех K цветов, и 1 - если хотя бы какого-то цвета не хватает. Тот для кого условие даст 1 (а оно точно будет таким для того, перед кем стоит меньше К мудрецов) делает вывод, что у него шляпа недостающего цвета. Если цветов больше, чем мудрецов - первому же говорящему только и остаётся что назвать любой цвет, которого он не видит перед собой.
ОтветитьУдалить
Ответы
Николай Сергушенков25.06.2012, 10:51
Как вариант - договориться о передаче кодированной информации одним словом: можно сказать "пас", а можно "пааас", "п-п-пас", "пассс", можно сказать громко, можно - тихо, можно - после большой паузы
ОтветитьУдалить
Ответы
Vitalii25.06.2012, 13:56
Улучшить результат для k < 100 можно так:
смотреть на первого, если видишь что его цвет повторяется - пас, иначе - называешь его цвет.

Тогда хороших случаев будет будет тот в котором цвет первого есть ещё хотя бы у одного.

Это сработает для того случая когда использованы не все цвета.
Таких случаев больше чем случаи когда обязательно использованы все.
ОтветитьУдалить
Ответы
LisandreL26.06.2012, 00:58
Есть такой вариант:
Нумеруем цвета.
Хорошей называем ситуацию, если есть мудрец у которого номер цвета шапки совпадает с его порядковым номером (по модулю к).
Алгоритм: пока видим хорошую ситуацию - пасуем, как только очередной мудрец хорошей ситуации не видит - называет цвет, соответствующий его номеру. Проиграем только если хорошей ситуации изначально в построении нет.
Таким образом шанс на удачу: Q = 1 - ((k-1)/k)^100
Что даёт хороший результат на малых k: http://www.wolframalpha.com/input/?i=plot+y+%3D+1+-+%28%28x-1%29%2Fx%29%5E100%2C+x+from+1+to+300

Для интереса сравним с пресловутым 1/k:
Q - 1/k = 1 - ((k-1)/k)^100 - 1/k = {k^100 - (k-1)^100 - k^99}/k^100 = {(k-1)*k^99 - (k-1)^100} / k^100 = (k-1) * (k^99-(k-1)^99) / k^100, что >0 при k>1.
Таким образом Q>1/k, т.е. наша стратегия всегда лучше случайного выбора, что уже неплохо.
ОтветитьУдалить
Ответы
LisandreL26.06.2012, 01:06
Наглядное сравнение шансов нашего алгоритма и случайного выбора.
ОтветитьУдалить
Ответы
Анонимный26.06.2012, 08:48
Стратегия на вскидку. Извините если уже была озвучена, долго вчитываться в переписку нет времени.

1. Первый "голосующий" мудрец называет цвет наудачу, поскольку ему до этого не была сообщена никакая информация. Цвет наудачу ему надо выбирать таким образом, чтобы с минимальной вероятностью наступить на мину. Подробнее об этом попозже.

2. Следовательно следующий "голосующий" мудрец обязан попасть в яблочко на основе информации, переданной ему от первого "голосующего" мудреца.
Определение: "голосующий" мудрец - это тот, кто скажет любое слово кроме "пас".

3. Поскольку уже был первый голосующий, который передал тайное знание второму голосующему путем наступания на мину (если не повезло) или удачным образом и поскольку второй голосующий уже смог реализовать тайное знание прямым попаданием в яблочко, то все остальные мудрецы должны сказать "пас" чтобы не ухудшить имеющийся результат.

Под данную стратегию можно разработать несколько тактик. Причем скорее всего для разных K будет своя наиболее оптимальная тактика, например когда K "очень мало" или для "очень больших K".
ОтветитьУдалить
Ответы
asd26.06.2012, 23:09
О, доказал оптимальность решения с 1-((k-1)/k)^n (n=100). По крайней мере среди детерминированных стратегий. Оказывается, все просто. Осторожно, спойлер.

Рассмотрим стратегию чувака, отвечающего последним. Если все до него сказали "пас", у него нет никакой дополнительной информации, чтобы решить, что назвать (ведь он никого не видит). Значит нужно заранее договориться, какой конкретно цвет ему выбирать в этой ситуации. Назовем этот цвет x[1]. Предпоследний отвечающий чувак видит цвет последнего. Ясно, что если этот цвет равен x[1], то выгодно сказать "пас", потому что тогда первый ответит правильно, и мы выиграем. Иначе оказываемся в той же ситуации, что и раньше: надо называть цвет, а информации нет, значит надо называть фиксированный цвет, пусть x[2]. Аналогичные рассуждения можно по индукции провести для всех остальных, построив произвольную последовательность x[i], i=1..n. Показать, что от выбора иксов ничего не зависит, и получается та самая стратегия (что моя, что LisandreL) и те самые 1-((k-1)/k)^n.

С недетрминированными стратегиями (когда ответ зависит не только от видимых цветов и ответов предыдущих, но и от случайной величины) интуитивно ясно, что ничего лучше не получится, но доказать наверно немного сложнее.
ОтветитьУдалить
Ответы
Unknown27.06.2012, 00:08
если что, я не читал предыдущие комменты, может уже ответили
если k <= 100 и мудрецы знают, что это за k, то:

последний из них смотрит, сколько РАЗНЫХ шляп на предыдущих.
если их k, он пасует
если их k-1, он говорит, что на нем цвет #k

если он пасует, последним становится тот, кто был перед ним
вероятность выиграть - 100% (ну, или я облажался)

если k > 100, что им делать, пока не знаю
ОтветитьУдалить
Ответы
Анонимный27.06.2012, 12:40
По условию задачи "султан решил устроить им еще одно испытание...". Следовательно султан не решал устраивать 100% казнь, т.е. он не будет организовывать специальную подставу. Вернее сказать так:

Если мудрецы отыщут наиболее оптимальную стратегию среди всех возможных, то султан безусловно даст им шанс её реализовать, ибо он милостив. Причем эта выборка, которую султан наденет на головы своих бедных мудрецов, скорее всего приведет к их погибели в случае если мудрецы будут пытаться реализовать не самую оптимальную стратегию, ибо султан наимудрейший из всех мудрейших, а казнь должна быть показательной.

Исходя из этого наши мудрецы могут спокойно себе считать что они 100% останутся в живых в случае если они докажут себе что их стратегия является наиболее оптимальной.

Вот такой вот житейский ответ на вопрос "Можно ли его улучшить?"
ОтветитьУдалить
Ответы

Добавить комментарий

Привычка не думать

24 июн. 2012 г.