Головоломка C: сделать честную монету из необъективной монеты

Как определить вероятность того, что функция вернет 0 или 1 в следующем случае:

Пусть function_A возвращает 0 с вероятностью 40% и 1 с вероятностью 60%. Создайте function_B с вероятностью 50-50, используя только function_A.

Я подумал о следующем:

 function_B()
 {
     int result1=function_A();
     int result2=function_A();
     //two times 40% would result in 16% and 40%+60% would be 24%... two times 60%                        would be 36%
 }

Какая комбинация может дать 50-50?

garima 25.03.2011 источник

comment

Это домашнее задание? Я не хочу просто выйти и дать вам ответ, если вы должны делать это для задания. - templatetypedef 25.03.2011

comment

нет, не домашнее задание... я не могу придумать ответ с двумя вызовами функций.. - garima 25.03.2011

Ответы (6)

arrow_upward
75
arrow_downward

Это классическая вероятностная головоломка, и, насколько мне известно, вы не можете решить ее всего двумя вызовами функции. Однако вы можете сделать это с небольшим ожидаемым числом вызовов функции.

Наблюдение состоит в том, что если у вас есть смещенная монета, которая выпадает орлом с вероятностью p, и если вы подбрасываете монету дважды, то:

Вероятность того, что решка выпадет дважды, равна p².
Вероятность того, что сначала выпадет орёл, а потом решка, равна p(1-p).
Вероятность того, что сначала выпадет решка, а затем решка, равна (1-p)p.
Вероятность того, что дважды выпадет решка, равна (1-p)².

Теперь предположим, что вы несколько раз подбрасываете две монеты, пока они не получат разное значение. Если это произойдет, какова вероятность того, что первая монета выпадет орлом? Ну, если мы применим закон Байеса, мы получим, что

P(первая монета решка | обе монеты разные) = P(обе монеты разные | первая монета решка) P(первая монета решка) / P(обе монеты разные)

Вероятность того, что первая монета выпадет орлом, равна p, так как при любом подбрасывании монеты выпадет орел с вероятностью p. Вероятность того, что обе монеты различны при условии, что первая монета выпадет решкой, равна вероятности того, что вторая монета выпадет решкой, которая равна (1 - p). Наконец, вероятность того, что обе монеты различны, равна 2p(1-p), поскольку, если вы посмотрите на приведенную выше таблицу вероятностей, это может произойти двумя способами, каждый из которых имеет вероятность p(1-p). Упрощая, получаем, что

P(первая монета решка | обе монеты разные) = p (1-p) / (2p(1-p)) = 1/2.

Но какова вероятность того, что первая монета выпадет решкой, если монеты разные? Что ж, это то же самое, что и вероятность того, что первая монета не выпадет орлом, когда обе монеты разные, то есть 1 - 1/2 = 1/2.

Другими словами, если вы продолжаете подбрасывать две монеты до тех пор, пока они не получат разные значения, а затем берете значение первой подброшенной монеты, вы в конечном итоге получаете честную монету из необъективной монеты!

В C это может выглядеть так:

bool FairCoinFromBiasedCoin() {
    bool coin1, coin2;

    do {
        coin1 = function_A();
        coin2 = function_A();
    } while (coin1 == coin2);

    return coin1;
}

Это может показаться ужасно неэффективным, но на самом деле это не так уж и плохо. Вероятность того, что он завершится на каждой итерации, равна 2p(1 - p). При ожидании это означает, что нам нужно 1/(2p(1-p)) итераций, прежде чем этот цикл завершится. Для p = 40% это 1/(2 x 0,4 x 0,6) = 1/0,48 ~= 2,083 итерации. Каждая итерация подбрасывает две монеты, поэтому нам нужно, как ожидается, около 4,16 подбрасываний монеты, чтобы получить честный бросок.

Надеюсь это поможет!

templatetypedef 25.03.2011

comment

это заслуживает хорошего значка ответа. +1 - sehe; 22.09.2011

comment

На самом деле вы можете сделать лучше, но кодирование становится немного грязным. Идея состоит в том, что если последовательности HHTT и TTHH имеют одинаковую вероятность появления (где H — решка, а T — решка). Вы даже можете использовать более длинные последовательности. Тем, кто заинтересован, эта статья будет полезна для чтения. - FelixCQ; 23.09.2011

comment

@FelixCQ я получаю сообщение об ошибке You don't have permission to access /~libcs124/CS/coinflip3.pdf on this server. Есть ли другая ссылка, которой вы можете поделиться? - Aseem Goyal; 05.12.2013

comment

@ac_c0der, вот еще одна ссылка на ту же статью. В любом случае вы сможете найти его по названию: «Бросание предвзятой монеты» Майкла Митценмахера. - FelixCQ; 28.12.2013

comment

Вы не можете сделать это всего двумя вызовами, используя результаты, поскольку есть только четыре возможных исхода, и вы не можете объединить их в два непересекающихся события с равной вероятностью. - G. Bach; 13.04.2014

comment

Как ожидание завершения цикла равно 1/(2p(1-p))? Кто-нибудь хочет объяснить? - Rafay Khan; 29.09.2019

comment

@RafayKhan Вы можете думать о количестве подбрасываний, прежде чем выпадет решка на монете с вероятностью q выпадения решки, как геометрическая случайная величина с параметром q. Ознакомьтесь с разделом о моментах для доказательства того, что ожидаемое значение этой переменной равно 1/q. - templatetypedef; 29.09.2019

arrow_upward
8
arrow_downward

Вот подход, который будет работать, но он требует повторных испытаний.

вероятность того, что function_A вернет 1: P(1) = p (например, p=60%)

вероятность того, что function_A вернет 0: P(0) = 1 - p

вероятность определенной последовательности возвращаемых значений a,b,... при последовательных вызовах function_A равна P(a)P(b)...
Обратите внимание, что определенные комбинации будут возникать с равными шансами, например:
      P(a)*P(b) === P(b)*P(a)
 P(a)*P(b)*P(c) === P(b)*P(c)*P(a)

 etc.
мы можем использовать этот факт при выборе только последовательностей (1,0) или (0,1), тогда мы знаем, что вероятность любого равна
    P(1)*P(0)/(P(1)*P(0) + P(0)*P(1)) 
 => x / (x + x)
 => 1 / 2

Это становится рецептом реализации function_B:

вызывать function_A несколько раз, пока не получим последовательность (0,1) или (1,0)
мы последовательно возвращаем либо первый, либо последний элемент последовательности (оба будут иметь равные шансы быть 0 или 1)

function_B()
{
    do
    {
        int a = function_A();
        int b = function_A();
    } while( (a ^ b) == 0 ); // until a != b

    return a;
}

Shamim Hafiz 25.03.2011

comment

@MAK: Идея состоит в том, чтобы вероятность того, что 0 и 1 были одинаковыми. Если вы заметили, когда функция возвращает значение, 50-50 на значение должны быть 0 или 1. - Shamim Hafiz; 25.03.2011

comment

@Shamim: если ты наблюдаешь... - неважно, наблюдаешь ли ты (это не кот Шрёдингера). Я думаю, вы, вероятно, имели в виду, что я не знаю, как объяснить, вы просто разберетесь :) - sehe; 22.09.2011

comment

@sehe: Ну, я могу это объяснить, но это было бы слишком перегружено для поля комментариев :). На самом деле, предложение, которое я использовал, является клише, некоторые учебники объясняют ответы, используя такой язык. - Shamim Hafiz; 23.09.2011

comment

@Shamim: я наполовину высмеивал отсутствие (или небрежность?) объяснения (а) ТАК не учебник (б) учебники используют наблюдать для сопровождения шагов дедуктивного рассуждения - вы в основном просто предположил, что есть несколько логических шагов (c) Я нашел место в вашем поле для ответов, чтобы исправить ситуацию. (подсказка: обрезанные комментарии не подходят; то же самое для полей комментариев) - sehe; 23.09.2011

comment

@sehe: Хм. Спасибо за дополнительное объяснение и совет :) - Shamim Hafiz; 23.09.2011

arrow_upward
2
arrow_downward

Дано:

События = {голова, хвост}
монета нечестная => P (орел) = p и P (решка) = 1-p

Алгоритм:

Сгенерируйте выборку событий N1 (орел или решка), используя нечестную монету.
оценить его выборочное среднее значение m1 = (#heads)/N1
Создайте еще одну выборку событий N2 (орел или решка), используя нечестные монеты.
оценить выборочное среднее значение m2 = (#голов)/N2
если (m1 > m2) вернуть голову, иначе вернуть хвост

Примечания:

События, возвращенные на шаге № 5 выше, равновероятны (P (голова) = P (хвост) = 0,5)
Если #5 повторяется много раз, то его выборочное среднее --> 0,5 независимо от p
Если N1 --> бесконечность, то m1 --> true означает p
Чтобы сгенерировать выход честной монеты, вам нужно много независимых выборок (здесь бросаний) нечестной монеты. Чем больше, тем лучше.

Интуиция. Хотя монета нечестна, отклонение оценочного среднего значения от истинного является случайным и может быть как положительным, так и отрицательным с равной вероятностью. Поскольку истинное среднее значение не указано, оно оценивается по другой выборке.

JoelP 05.10.2013

arrow_upward
0
arrow_downward

Выполнимо. Однако двух вызовов этих функций будет недостаточно. Подумайте о том, чтобы вызывать функцию снова и снова, и приближаться к 50/50.

iluxa 25.03.2011

comment

Это приблизительный подход, но он может иметь ошибки с плавающей запятой. Это можно сделать без какой-либо ошибки с плавающей запятой. - Shamim Hafiz; 25.03.2011

comment

почему приблизительный подход имеет какое-либо отношение к ошибкам с плавающей запятой? Вероятность того, что вы получите 0 или 1, просто не 50%. - steabert; 25.03.2011

arrow_upward
0
arrow_downward

Я задавался вопросом, должно ли работать что-то рекурсивное, с увеличением глубины шанс для 0 или 1 должен быть все ближе и ближе к 0,5. На 1 уровне модифицированный шанс равен p'=p*p+(p-1)*(p-1)

depth = 10;
int coin(depth) {
    if (depth == 0) {
        return function_A();
    }
    p1 = coin(depth-1);
    p2 = coin(depth-1);
    if (p1 == p2) {
        return 1;
    } else {
        return 0;
    }
}

steabert 25.03.2011

arrow_upward
-1
arrow_downward

def fairCoin(biasedCoin):
coin1, coin2 = 0,0
while coin1 == coin2:
coin1, coin2 = biasedCoin(), biasedCoin()
return coin1

Это изначально умная идея фон Неймана. Если у нас есть смещенная монета (то есть монета, которая выпадает решкой с вероятностью, отличной от 1/2), мы можем смоделировать честную монету, подбрасывая пары монет, пока два результата не станут разными. Учитывая, что у нас разные результаты, вероятность того, что первый выпадет «орел», а второй — «решка», такая же, как вероятность выпадения «решки», а затем «орла». Так что, если мы просто вернем значение первой монеты, мы получим «орел» или «решку» с одинаковой вероятностью, т.е. 1/2. Этот ответ взят из - http://jeremykun.com/08/02/2014/симуляция-честной-монеты-с-пристрастной-монетой/ подробнее об этом читайте на http://en.wikipedia.org/wiki/Fair_coin#Fair_results_from_a_biased_coin

user3107673 10.02.2015

comment

Это дубликат принятого в настоящее время ответа. - Jeremy West; 10.02.2015

Головоломка C: сделать честную монету из необъективной монеты

Ответы (6)

Похожие вопросы