В урне два белых и один черный шар. Достается наугад один шар, затем возвращается в корзину и так n (для примера n=100) раз. Необходимо найти наиболее ожидаемое количество серий (по признаку повтора одного цвета) в процентном соотношении к n. Пример серий: БББЧЧБЧ...-серия из трех белых, серия из двух черных, серия из одного белого...

если p и q не равны, то задача сильно усложняется и общей формулы нет.

Сделал статистику: А)4721 (включают элементарные события с 2/3 и 1/3 вероятностью) шагов. Серии из элементарных событий с вероятностью 2/3: 1)396;2)241;3)169;4)111;5)71;6)48;7)29;8)22;9)14;10)4;11)3;12)3;13)5;14)4;15)1;16)2;17)1;20)1. Б)10 000 (включают элементарные события с 2/3 и 1/3 вероятностью) шагов. Серии из элементарных событий с вероятностью 2/3: 1)744;2)490;3)329;4)225;5)158;6)96;7)68;8)36;9)32;10)16;11)9;12)9;13)8;14)6;16)3;17)1;18)1;20)1. Как по данной статистике вычислить математическое ожидание серий различной длины с вероятностью 2/3 для n=100 шагов.

задан 22 Сен '19 13:39

@vovan r: для случая вероятностей 2/3 и 1/3 матожидание числа серий при n испытаниях уже было найдено в недавнем вопросе. Ответ был (4n+5)/9. Это легко обобщается на случай любых вероятностей. Там будет 2pq(n-1)+1, где q=1-p. То есть общая формула есть, а задача совсем не сложная.

(22 Сен '19 14:04) falcao

Уважаемый Виктор как вычислить математическое ожидание серий (вероятность элементарных событий2/3) длиной в 1(...ЧБЧ...) и 2(...ЧББЧ...) для n=100 шагов? Приведите пример пожалуйста!

(22 Сен '19 15:07) vovan r

@vovan r: я как раз предлагал такую задачу рассмотреть. Тут нужен не пример, а ответ. В тексте вопроса лучше всего было написать то, что у Вас сказано в комментарии.

(22 Сен '19 19:35) falcao
10|600 символов нужно символов осталось
1

Пусть проводится n независимых испытаний с вероятностью успеха p. Мы фиксируем серии успехов (Б) и неуспехов (Ч). Найдём матожидание числа серий длиной 1. При n=1 серия всегда одна. При n=2 мы имеем 0 серий или 2 серии. Вероятность последнего события (БЧ или ЧБ) равна 2pq. Матожидание равно 4pq.

При очередном испытании число серий длиной 1 может увеличиться на 1, не измениться, или уменьшиться на 1. Первое происходит, если результат (n+1)-го испытания отличается от результата n-го. Вероятность 2pq, где q=1-p. Второй случай нас не интересует. Третий имеет место, когда на конце была серия длиной 1, а мы к ней далее приписали такой же символ, удлинив её. При n>=2 у нас на конце было БЧ, и далее выпало Ч, или же ЧБ, и далее выпало Б. Вероятность pq.

Таким образом, для матожидания S(n) числа серий длиной 1 при n испытаниях мы имеем равенство S(n+1)-S(n)=2pq-pq=pq при n>=2, то есть S(n)=(n+2)pq. Для случая p=2/3 имеем S(n)=2(n+2)/9. То есть при n=100 серий из одного члена будет около 23.

Ранее было установлено, что общее число серий для этого же случая равно примерно 4n/9, то есть примерно половина из них имеет длину 1.

Для серий длиной 2 рассуждение происходит похожим образом. Для n=1 имеем 0, для n=2 будет p^2+q^2. При n=3 получится 2pq. Далее на каждом шаге число серий длиной 2 увеличивается на одну с вероятностью pq (когда после БЧ появляется Ч или после ЧБ появляется Б). Уменьшение на одну такую серию возможно после БЧЧ или ЧББ, когда появятся Ч и Б соответственно. Вероятность (pq)(p^2+q^2). Итого коэффициент увеличения составит pq(1-p^2-q^2)=2(p(1-p))^2. При p=2/3 это 8/81. То есть серий длиной 2 при 100 испытаниях получается около 10.

Добавлю, что для серий длиной 3 тем же способом получается величина (p(1-p))^2 как доля от n. Для p=2/3 это 4/81, то есть серий длиной 3 примерно вдвое меньше, чем серий длиной 2.

Типовая статистика для p=2/3 и n=10000 испытаний (в скобках число серий данной длины): 2313 (1), 971 (2), 477 (3). При другой прогонке: 2252, 1019, 479. По теории должно быть около 2222, 988, 494, то есть всё сходится.

ссылка

отвечен 22 Сен '19 20:20

изменен 23 Сен '19 1:09

@vovan r: значит, Вам надо свою статистику перепроверить. У меня помимо самих расчётов была ещё проверка методом Монте-Карло -- я обычно в таких случаях пишу программы. Всё совпало с теоретическими значениями.

(22 Сен '19 21:18) falcao

@vovan r: про серии длиной 3 я не знаю, но там процент считается тем же методом. Как уже говорилось выше, серий длиной 1 будет примерно 23% от числа испытаний, а серий длиной 2 примерно 12%.

Проценты там близкие: для p=1/2 будут числа 1/4 и 1/8. А для p=2/3 получается 2/9 и 10/81, то есть совсем близко.

(22 Сен '19 22:58) falcao

@vovan r: если Ваш результат не сходится с данными как теории, так и статистики (я тоже делал всё на компьютере), но имеет смысл или поискать ошибку в программе, или сделать новый эксперимент.

(22 Сен '19 23:46) falcao

@vovan r: я вроде уже ответил выше. Для серий длиной 3 не считал, а для среднего числа серий при n испытаниях надо n=5000 и 10000 умножить на коэффициенты 2/9 и 10/81.

Обсуждение ходит по одному и тому же месту. Тут скоро исчерпается лимит на комментарии :)

(22 Сен '19 23:54) falcao

@vovan r: перепроверить лишний раз статистикой не лишне. Я стал прогонять программу, и процент для серий длиной 1 хорошо совпадал, а для серий длиной 2 был чуть ниже. Обнаружилось, что я привёл немного не те формулы. Сейчас я это дело исправил. Серий длиной 2 будет 8/81 от n, то есть 10%, а не 12. Это дело сходится достаточно хорошо. Попутно я посчитал коэффициент для серий длиной 3. Он равен 4/81. Там же приведены статистические данные прогонок для 10000 испытаний.

(23 Сен '19 1:11) falcao
10|600 символов нужно символов осталось
Ваш ответ

Если вы не нашли ответ, задайте вопрос.

Здравствуйте

Математика - это совместно редактируемый форум вопросов и ответов для начинающих и опытных математиков, с особенным акцентом на компьютерные науки.

Присоединяйтесь!

отмечен:

×3,357
×1,463

задан
22 Сен '19 13:39

показан
281 раз

обновлен
23 Сен '19 8:06

Отслеживать вопрос

по почте:

Зарегистрировавшись, вы сможете подписаться на любые обновления

по RSS:

Ответы

Ответы и Комментарии

Дизайн сайта/логотип © «Сеть Знаний». Контент распространяется под лицензией cc by-sa 3.0 с обязательным указанием авторства.
Рейтинг@Mail.ru