?

Log in

No account? Create an account

Орел или решка? - АКАПУЛЬКОПСИС NOW!

Oct. 18th, 2016

11:35 pm - Орел или решка?

Previous Entry Share Next Entry

В одном из прошлых псто про вероятности невероятного (там где про Лору Бакстон в двух экз.) было упоминание любопытного эксперимента со стократным подбрасыванием монетки. Участников разделили на две группы, первая должна была сто раз подбрасывать монетку и записывать выпадающие орлы и решки, вторая придумывала случайную последовательность в уме. Потом ведущий определял, какой из результатов честный, а какой из головы. В случае, про который я слышал в подкасте radiolab, честная последовательность отличалась тем, что в ней был фрагмент из семи орлов подряд, в то время как у придуманной было не более четырех одинаковых значений друг за дружкой. Вторая группа специально не рисовала много одинаковых значений, чтобы последовательность выглядела послучайней. Но парадокс в том, что в настоящей случайной серии из ста подбрасываний появление длинных участков в семь и более орлов или решек подряд гораздо более вероятно, чем вариант, когда самый длинный интервал одинаковых значений достаточно короткий, например четыре. Говоря конкретно про эти семь и четыре, можно вычислить, что первое почти в двадцать раз более вероятно, чем второе. Если вам интересно, почему так происходит и как посчитать эти вероятности, то я постараюсь объяснить.


Математику случая в подбрасывании монетки объяснять не очень сложно, потому что здесь расчеты вероятностей мало расходятся со "здравым смыслом", по крайней мере пока речь идет о небольших последовательностях. Например, очевидно, что вероятность выпадения орла при однократном подбрасывании равна 50% или 1/2. Вероятность получить двух орлов при двух подбрасываниях 1/4, трех подряд при трех подбрасываниях = 1/8 и т.д. Это достаточно легко принять на веру, даже не вникая в определения из учебников, что такое независимые события и почему их вероятности можно (нужно!) перемножать. Ответ 1/8 получается еще простым перебором всех вариантов и выяснением, какая доля всех возможных исходов удовлетворяет условиям. Вот все возможные комбинации орлов (О) и решек (Р) при трех подбрасываниях:

1  О О О     5   Р О О 
2  О О Р     6   Р О Р
3  О Р О     7   Р Р О
4  О Р Р     8   Р Р Р

Всего восемь вариантов (2*2*2 = 23), подходит только один из них, поэтому вероятность 1/8. Если три решки нас порадуют не меньше трех орлов, то вероятность получить три орла (№1) или три решки (№8) будет 2/8 = 1/4.

1/2 и 1/8 не означают, что подбросив монетку два раза обязательно получим сначала решку, потом орла или наоборот. Или если монетку трижды подбросят восемь человек, то вовсе не факт, что три орла обязательно выпадут и обязательно только у одного. Эти числа говорят правду на длинных сериях экспериментов. То есть если бросать монетку очень долго, то орлы и решки распределятся примерно поровну. Если очень долго повторять эксперимент с тремя подбрасываниями, то примерно 12.5% результатов будут три орла. Чем больше экспериментов, тем "примерно" становится все более похоже на "почти" и "практически". Но даже в единичном случае вероятность чего-либо отражает наши житейские ожидания. Если мы, скажем, верим врачу, что вероятность успеха операции 98%, то ложимся под наркоз с более легким сердцем, хотя вполне можем оказаться тем самым одним из пятидесяти, которому не повезет.

Прежде чем взяться за последовательность в сто подбрасываний и семь орлов или решек, потренируемся на маленьком примере, который еще можно посчитать на пальцах, но из которого уже будет понятен принцип. Рассмотрим серию из пяти подбрасываний и определим насколько вероятно получить подряд четыре орла или четыре решки. Ниже расписаны все 32 (25) возможные комбинации орлов и решек для пяти подбрасываний.

1  О О О О О       9  О Р О О О      17  Р О О О О      25  Р Р О О О
2  О О О О Р      10  О Р О О Р      18  Р О О О Р      26  Р Р О О Р
3  О О О Р О      11  О Р О Р О      19  Р О О Р О      27  Р Р О Р О
4  О О О Р Р      12  О Р О Р Р      20  Р О О Р Р      28  Р Р О Р Р

5  О О Р О О      13  О Р Р О О      21  Р О Р О О      29  Р Р Р О О
6  О О Р О Р      14  О Р Р О Р      22  Р О Р О Р      30  Р Р Р О Р
7  О О Р Р О      15  О Р Р Р О      23  Р О Р Р О      31  Р Р Р Р О
8  О О Р Р Р      16  О Р Р Р Р      24  Р О Р Р Р      32  Р Р Р Р Р

Математики называют это пространством элементарных событий. Из тридцати двух вариантов содержат серии из четырех и более одинаковых значений подряд только шесть исходов: №№ 1, 2, 16, 17, 31, 32. То есть вероятность получить серию как минимум из четырех одинаковых значений подряд в пяти подбрасываниях равна 6/32 = 3/16. Остальные варианты соответствуют исходам, когда подряд идут не более трех одинаковых значений. Таких вариантов 26, значит вероятность получить подряд не больше трех одинаковых значений равна 26/32 = 13/16. Можно заметить, что сумма вероятностей равна единице, это очень полезный факт, который может когда-нибудь пригодиться. Порой бывает проще посчитать вероятность противоположного события и вычесть из единицы.

Ок, приступим к сотням и семеркам. Есть 2100 различных вариантов последовательностей из ста орлов и решек. Два в сотой степени равно 1267650600228229401496703205376. Осталось подсчитать количество вариантов содержащих подряд семь или больше одинаковых значений и разделить на общее число исходов. Кажется, что проще сказать чем сделать, но на самом деле все не так страшно.

Определим количество последовательностей из ста значений орел-решка, где подряд идут шесть или меньше одинаковых элементов, то есть последовательностей вида

  ООООРРРООРРРРРРООО .... ОООРРОО
     4  3 2     6  3 ....   3 2 2

Четыре орла, три решки, два орла, шесть решек, три орла... и так далее. Если перебрать все такие варианты, а потом вычесть из общего количества, то останутся как раз "семь или больше", то что нужно. Как же посчитать эти "шесть или меньше"? Если посмотреть нижний ряд, то видно что там идут различные числа от 1 до 6, сумма которых равна 100. То есть вариант "шесть или меньше" это вариант разбиения числа 100 на слагаемые, каждое из которых не больше шести. Подсчет разбиений - это известная задача комбинаторики, в любом учебнике или популярной книжке ей отводится несколько страниц, а иногда и целая глава. Не буду писать формулу и ее вывод, мне кажется это стоит отдельного постинга, но поверьте что число таких разбиений равно 290078479914610587823630044098. Заметим, что разбиению 43263... кроме указанной выше последовательности ООООРРРООРРРРРРООО... соответствует еще и РРРРОООРРООООООРРР... то есть орлы и решки переставлены местами. Значит умножаем на два, вычитаем из 2100, а потом делим на 2100 и получаем

(1267650600228229401496703205376 - 290078479914610587823630044098 * 2 )/ 1267650600228229401496703205376 = 0,542336855

Ого, то есть получить семь орлов или решек подряд при ста подбрасываниях не только вполне вероятно, но шансов что выпадет семь или больше вообще около 54% Для сравнения можно аналогично посчитать вероятность получить максимальную серию меньше чем из пяти подряд. Она равна всего лишь 0.02831, меньше трех процентов! Если посчитать для остальных значений, то получится такая картинка. Это два почти одинаковых графика, только зеркально отраженных, на первом вероятность того, что максимальная последовательность будет больше или равна числам, отложенным по нижней оси. А на втором, соответственно вероятность того, что длина последовательности будет меньше числa на нижней оси. Кому какой график приятней смотреть.



Если бросать монетку не сто раз, а больше, то будет увеличиваться и вероятность получить все более длинную максимальную последовательность орлов или решек подряд. Правда, вероятность эта растет крайне медленно. Если посмотреть на графики, то видно, что даже в случае 100000 подбрасываний за шанс фифти-фифти пролезает только последовательность длиной 17. Не так уж много.



Числа и формулы дело полезное, но как бы это проверить на практике? Вспомним, что расчитанные вероятности имеют смысл на больших выборках. То есть, неверующим фомам чтобы убедиться в правильности полученных процентов хорошо бы побросать сто раз монетку, а потом еще сто раз, а потом еще. И так много много раз, набрать статистику как часто максимальная последовательность была семь и больше, как часто меньше пяти и так далее. Живьем такой эксперимент провести затруднительно, так что пусть этим компьютер занимается. Внутре него есть неонка и генератор псведослучайных чисел, который хоть даже и "псевдо", но для нашей задачи вполне подойдет. Я написал программу (можно посмотреть и запустить тут: http://codepad.org/U52eCBCo) которая эксперимент с сотней подбрасываний симметричной монеты повторяет 10000 раз и считает каждый раз длину максимальной последовательности из одинаковых значений подряд. Получилась вот такое распределение



Постойте-ка, сначала мы посчитали, что вероятность более 50% имеет вариант где подряд идут семь орлов или решек, а тут видно, что чаще всего максимальная последовательность была всего лишь в шесть значений подряд. Все верно, но посчитана то была вероятность "семь и больше", ведь восемь орлов или решек подряд нас удивили и порадовали бы не меньше, чем семь. А ведь когда-то выпадет и девять и десять! Видно, что столбец с семеркой и "хвост" в правой части весит больше чем начало гистограммы. Для наглядности в следующем графике эти же значения показаны с накоплением, то есть в каждом столбце соответствующее значение плюс сумма всех предыдущих. Видно, что для шестерки столбец еще не поднимается до половины, значит сумма всех остальных вариантов, а именно "семь и больше" превышает 50%. Если запустить программу и посмотреть на ее вывод, то для семерки и пятерки там будут числа очень похожие на рассчитанные теоретические значения. Потому что нет ничего практичнее хорошей теории!

Ну и на закуску, для тех кто не верит расчетам и численному моделированию, а только натурному эксперименту. Конечно, любой единичный опыт ничего доказать не может, но проиллюстрировать вполне



Я не стал даже добрасывать до ста раз, сорок четвертая монетка оказалась седьмой решкой подряд.



Оригинал записи на dreamwidth.org.

Comments:

[User Picture]
From:freedom_of_sea
Date:October 18th, 2016 09:08 pm (UTC)
(Link)
зачет и респект!
(Reply) (Thread)
[User Picture]
From:palindromer
Date:October 18th, 2016 09:23 pm (UTC)
(Link)
Спасибо. Правда, когда дописывал последние абзацы и на картинках глянец наводил, то начало казаться, что пишу про самоочевидные вещи, вроде 2+2=4.
(Reply) (Parent) (Thread)
[User Picture]
From:contrstream
Date:October 19th, 2016 08:00 am (UTC)
(Link)
Фигассе, очевидные! Интересно очень и ново
(Reply) (Parent) (Thread)
[User Picture]
From:vaf
Date:October 18th, 2016 09:17 pm (UTC)
(Link)
Блестяще!
(Reply) (Thread)
[User Picture]
From:palindromer
Date:October 18th, 2016 09:26 pm (UTC)
(Link)
Спасибо, я постарался. Заодно разобрался немного, как в gnuplot графики рисовать, то есть с пользой вечер провел.
(Reply) (Parent) (Thread)
From:bulat_s
Date:October 18th, 2016 10:14 pm (UTC)
(Link)
Да уж, постарался! Интересно.
(Reply) (Parent) (Thread)
[User Picture]
From:zanozakat
Date:October 18th, 2016 11:34 pm (UTC)
(Link)

Спасибо) вспомнила тервер в универе. Мой любимый препод там был, но вот такую задачку не рассказывал. Буду знать!

(Reply) (Thread)
[User Picture]
From:palindromer
Date:October 19th, 2016 06:39 pm (UTC)
(Link)
У нас именно этот предмет уныло читали, не повезло с преподом. Но хватало другой математики, там было повеселей.
(Reply) (Parent) (Thread)
[User Picture]
From:woodenfriend
Date:October 19th, 2016 07:08 am (UTC)
(Link)
вещи вроде очевидные. но количественные характеристики непрерывной последовательности орлов неочевидны.
(Reply) (Thread)
[User Picture]
From:woodenfriend
Date:October 19th, 2016 07:09 am (UTC)
(Link)
кстати о нумизматике, ты подметил что герб на монетах поменялся в этом году? :)
(Reply) (Thread)
[User Picture]
From:palindromer
Date:October 19th, 2016 06:42 pm (UTC)
(Link)
Кстати, нет. А мог бы! Потому что я последние пару месяцев без пластика. Ситибанковскую карточку закрыл, жалко стало 250р в месяц за обслуживание платить, а на новой работе все никак зарплатку не сделают. Расплачиваюсь наличными, так непривычно уже! Мелочь в карманах звенит, но не приглядывался к монеткам, надо будет обратить внимание.
(Reply) (Parent) (Thread)
[User Picture]
From:nameless__one
Date:October 19th, 2016 08:20 am (UTC)
(Link)
Отлично расписал!

Возник, кстати, связанный вопрос - как человек может создать как можно более случайную последовательность сам? Понятно что если есть монетка, то проще всего кидать её и записывать. Но предположим тебе нужно сгенерировать такую последовательность из головы, сидя на стуле с завязанными глазами. Опираться на какие-то внутренние физиологические или ментальные процессы? Тема на подумать.
(Reply) (Thread)
[User Picture]
From:palindromer
Date:October 19th, 2016 06:52 pm (UTC)
(Link)
Трудно без подручных средств. Как вариант - вспоминать наизусть какие-нибудь тексты и очередное число выдавать в зависимости от того на какую букву начинается слово, о которое споткнулся. Типа 1 если согласная, 0 если гласная или как-нибудь еще. Правда распределение букв в языке не случайное и не равномерное, придется придумывать зависимость похитрей.
(Reply) (Parent) (Thread)
[User Picture]
From:nameless__one
Date:October 19th, 2016 08:24 am (UTC)
(Link)
Из неинтуитивных следствий тервера мне нравится пример с быстрым нарастанием вероятности совпадения дней рождения у двух человек по мере роста группы. Периодически развлекался, задавая друзьям вопрос "какова вероятность совпадения двух дней рождения в случайной группе из 23-х человек?".
(Reply) (Thread)
[User Picture]
From:zanozakat
Date:October 19th, 2016 09:00 am (UTC)
(Link)
я училась в классе из 26 человек, у трех пар были дни рождения в один день) в том числе и у меня был вместе с одним мальчиком, с которым мы сидели за одной партой. одной из пар правда были девочки сестры-двойняшки. но все равно считается!
(Reply) (Parent) (Thread)
[User Picture]
From:nameless__one
Date:October 19th, 2016 09:06 am (UTC)
(Link)
Ага - при желании можно сделать поправку на то что школьный класс не является случайным с точки зрения дней рождения. В частности как раз потому что если у человека есть близнец, то он вероятно будет в том же классе. Нужно тогда раздобыть частотности близнецов.

Наверное есть и ещё какие-то факторы, делающий школьный класс неслучайным в контексте дней рождения.
(Reply) (Parent) (Thread)
[User Picture]
From:newel
Date:October 21st, 2016 01:10 pm (UTC)
(Link)
у тебя на фото 8 решек подряд (45) - еще круче

увы, монетизировать это можно только через пари, но все закончится как всегда - канделябром ))
(Reply) (Thread)
[User Picture]
From:palindromer
Date:October 21st, 2016 10:17 pm (UTC)
(Link)
А что канделябром то? У меня все честно и даже вон ходы записаны!
(Reply) (Parent) (Thread)
[User Picture]
From:newel
Date:October 24th, 2016 05:53 am (UTC)
(Link)
где деньги, там и канделябр рано или поздно ))
(Reply) (Parent) (Thread)