Problemă cu ruinarea jucătorului

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită la 13 februarie 2020; verificările necesită 5 modificări .

Problema ruinării unui jucător  este o problemă din domeniul teoriei probabilităților . A fost considerată în detaliu de către matematicianul rus A. N. Shiryaev în monografia „Probabilitatea” [1] .

Formulare

La masă sunt doi jucători . Primul are ruble la dispoziție, al doilea are ruble la dispoziție . În fața lor, pe masă se află o monedă asimetrică ( probabilitatea ca un avers să cadă poate fi egală cu orice număr de la 0 la 1 inclusiv). Dacă reversul cade pe monedă, atunci primul jucător câștigă rubla (al doilea jucător îl plătește pe primul 1 rublă), iar dacă reversul cade, primul jucător îl plătește pe a doua rublă. Este necesar să se găsească probabilitatea ca unul dintre jucători să piardă la zero în trepte și probabilitatea de a pierde fiecare jucător de noroc. De asemenea, este necesar să se calculeze durata medie a jocului.

Această situație poate fi modelată într-un mod similar: există o particulă rătăcitoare și un coridor . Luăm în considerare probabilitatea ca particula să părăsească coridorul în trepte (alunecă prin peretele superior sau inferior).

Schema Bernoulli

Luați în considerare schema Bernoulli cu încercări.

Fie  un spațiu de probabilitate, unde

În expresia de mai sus, numărul de unități abandonate poate fi găsit astfel: .

Introducem o succesiune de variabile aleatoare Bernoulli:

Subproblemă de normalizare a probabilității

Demonstrează asta


Soluţie

Acest lucru este adevărat datorită faptului că

, deoarece prin conditie .

Subproblema privind independența variabilelor aleatoare ξ i

Demonstrează asta și sunt independenți.


Soluţie

Independenţa variabilelor aleatoare înseamnă că

hai sa o aratam:

Mers aleatoriu

Pentru schema Bernoulli, suntem de acord cu următoarea semnificație a variabilei aleatoare ξ: înseamnă că al doilea jucător îl plătește pe primul, iar primul jucător îl plătește pe al doilea.

Să introducem o nouă notație:

, .

Numărul  este egal cu durata jocului, iar secvența poate fi considerată ca traiectoria unei mers aleatorii a unei particule care pornește de la zero, în timp ce egalitatea este evidentă și înseamnă că primul jucător îl câștigă pe cel de-al doilea (care poate fi negativ).


Fie ,  două numere întregi, , . Este necesar să se găsească probabilitatea cu care ieșirea particulei din coridorul delimitat de și se va realiza în trepte .

Mai mult, să  fie un număr întreg, . Să fie și pentru asta (ceea ce înseamnă că jucătorii au început să joace cu capital diferit de zero la dispoziție). Lasă . Să presupunem că dacă . Dacă particula nu a depășit niciodată granițele, atunci este nedefinită.

Pentru fiecare și momentul se numește momentul de oprire , care este o variabilă aleatoare definită pe spațiul evenimentelor elementare .  este evenimentul în care mersul aleatoriu , începând din punct , va părăsi intervalul la momentul respectiv . Să introducem o nouă notație: , pentru . Fie ,  probabilitățile ca particulele să părăsească intervalul de timp, respectiv, în punctele și .

Lasă ; este evident că (până la începerea jocului, particula se află în intervalul cu probabilitatea 1). Lasă acum . Apoi conform formulei probabilității totale

Subproblema recurentei

Demonstrează asta

(1 )

(2) .

Dovada.

(1) Să demonstrăm că .

, unde  este setul de traiectorii de forma , care părăsesc pentru prima dată intervalul în punctul (prezentat în figură). Dacă un vector aleatoriu se încadrează într-o traiectorie adecvată, atunci se încadrează în mulțimea . Să reprezentăm setul ca . Unirea disjunctă este legitimă deoarece orice particulă care trece de-a lungul unei traiectorii are .  sunt acele traiectorii din care .  sunt acele traiectorii din care . Rețineți că fiecare traiectorie de la este în corespondență unu-la-unu cu traiectoria de la . Corespondența unu-la-unu este dovedită prin contradicție . Să presupunem că (corespondență ambiguă); atunci această traiectorie nu va putea scoate particula din coridor în trepte (dar numai din cauza distanței inițiale de la peretele superior al coridorului). În sens invers, corespondența este și unu-la-unu din definiția: . De aici rezultă că (deoarece sunt variabile aleatoare independente distribuite identic ).

Există o altă modalitate de a demonstra:

.

Acest lucru este adevărat deoarece probabilitățile sunt independente (acest lucru a fost demonstrat mai devreme).


(2) În mod similar, vom demonstra că .

Fiecare traiectorie de la este în corespondență unu-la-unu cu traiectoria de la . De aici

Derivarea relației de recurență

Din ecuația pentru asta rezultă și este adevărat:

, pentru .


Formula probabilității totale ne oferă și următorul rezultat: .


De asemenea, rețineți că și, prin urmare, pentru . Această afirmație este adevărată, deoarece la orice traiectorie care scoate particula în mai puțini pași, se poate adăuga un pas ( ) la început, la care particula poate ajunge la punctul atât de la (pentru ) cât și de la ( ).

Găsirea probabilităților

Pentru suficient de mare , probabilitatea este aproape de  - rezolvarea ecuației în condițiile în care (ieșirea a avut loc imediat din punct  - sfârșitul jocului, primul jucător a câștigat), (primul jucător nu va câștiga niciodată dacă ieșirea are loc instantaneu la punctul ). Aceste condiţii decurg din faptul că . Acest lucru va fi demonstrat și în această secțiune.

Mai întâi obținem soluția ecuației . Lăsați jocul să fie nedrept ( ). În acest caz, găsim rădăcinile ecuației, adică . O soluție specială este imediat vizibilă: . Găsim o altă soluție folosind faptul că  este o funcție. Este indicat să folosiți o expresie cu relație , având în vedere că : . Prin urmare, este rezonabil să presupunem că . Adăugarea unei constante nu va schimba nimic deoarece .

Acum luați în considerare soluția generală: . Folosim aceleași condiții ca și , și obținem asta

Subproblemă privind unicitatea soluției

Să demonstrăm unicitatea soluției acestei probleme. Pentru a face acest lucru, vom arăta că orice soluție a problemei cu condiții la limită poate fi reprezentată ca .


Soluţie

Luați în considerare o soluție în condițiile , . Atunci este întotdeauna posibil să alegeți constante și astfel încât , . Apoi din ecuația problemei puse rezultă că . Apoi în cazul general . Prin urmare, soluția este unică. Exact aceeași linie de raționament poate fi aplicată la .

Limită convergența

Luați în considerare problema ratei de limitare a convergenței dintre și către și . Lăsați mersul să înceapă de la origine ( ). Pentru simplitate, notăm , , . Cu alte cuvinte,  este unu minus suma probabilităților ca particulele să părăsească coridorul — probabilitatea ca aceasta să rămână rătăcită pe coridor: . reprezintă un eveniment . Luați în considerare un număr , unde și un lanț de variabile aleatoare . Dacă notăm averea totală pentru , atunci . Există o explicație rezonabilă pentru aceasta: dacă particula iese din zero și nu depășește granițele, atunci suma pieselor este cu siguranță mai mică decât stocul total.

Subproblema privind independența variabilelor aleatoare ζ i

Să demonstrăm că sunt independenți și egal distribuiti . Este suficient să demonstrăm că sunt independenți, deoarece toate au distribuția binomială .


Soluţie

Să demonstrăm asta

.


Să revenim la considerarea convergenței.

Din ceea ce tocmai s-a dovedit rezultă că .

Luați în considerare varianța : (care este destul de legitimă, deoarece , și  este o variabilă aleatoare Bernoulli modificată ), prin urmare, pentru suficient de mare și , este adevărat: , unde , deoarece dacă , atunci . Dacă sau , atunci pentru suficient de mare este adevărat că , deci inegalitatea este adevărată . Din cele de mai sus rezultă că , unde . Din moment ce , atunci ; de când și , atunci ; la . Estimări similare sunt valabile și pentru diferențe și , deoarece aceste diferențe pot fi reduse la diferențe și pentru , .

Să revenim la considerație . Prin analogie cu soluția ecuației , putem spune că ecuația în condiții la limită are o soluție unică.

Este ușor de văzut asta pentru orice . Dacă jocul este corect (probabilitatea unui avers este egală cu probabilitatea unui revers), atunci soluțiile vor arăta astfel: , .

Răspuns despre probabilitatea ruinării

Cantitățile și pot fi numite probabilitățile de ruină ale primului și celui de-al doilea jucător cu capitalul inițial și cu numărul de mutări care tind spre infinit și caracterizează variabila aleatoare ca câștigul  primului jucător și pierderea primului jucător. În cele ce urmează, se va arăta de ce o astfel de secvență poate fi într-adevăr construită.

Dacă , atunci sensul intuitiv al funcției  este probabilitatea ca particula care a părăsit poziția să ajungă pe peretele superior ( ) mai devreme decât zero. Din formule se vede că

.

Paradoxul creșterii pariului pe jocul nefavorabil

Ce ar trebui să facă primul jucător dacă jocul este nefavorabil pentru el?

Probabilitatea sa de a pierde este dată de formula .


Acum lăsați primul jucător cu capital să decidă să dubleze pariul și să joace pentru două ruble, adică , , . Apoi notăm probabilitatea limită de ruinare a primului jucător astfel: .

Prin urmare , deoarece este înmulțită cu o fracție care este mai mare decât unu la .


Prin urmare, dacă probabilitatea de a obține aversul, care este atât de dorit pentru primul jucător, este mai mică decât , atunci este benefic pentru el să mărească pariul cu un factor de 1: acest lucru reduce probabilitatea ruinării sale terminale din cauza faptul că probabilitatea de a sări din coridor în punct crește . Această decizie pare paradoxală, întrucât se pare că într-o situație nefavorabilă ar trebui să scadă pariul și să se reducă pierderea, dar în realitate, cu un număr infinit de jocuri și un pariu mic, jucătorul care pierde va pierde în cele din urmă la zero, iar jucătorul. cu o miză mare are o șansă mai mare de a atinge numărul de aversuri suficient pentru a finaliza jocul la un moment dat .

Durata unei plimbări aleatorii

Luați în considerare durata medie a mersului particulei noastre. Să introducem așteptarea matematică a momentului în care jocul se oprește: pentru . Să derivăm o relație de recurență pentru așteptarea matematică a duratei jocului:

Pentru și am obținut o relație recursivă pentru funcția : for .


Să introducem condiții de limită: dacă jocul începe la punctul sau , atunci se va termina imediat - durata lui va fi egală cu 0: .


Din relația de recurență și condițiile la limită, se poate calcula . Deoarece , atunci există o limită care satisface relaţia : la executare . Aceste tranziții sunt similare cu cele pe care le-am luat în considerare atunci când am trecut în ecuația probabilității pierderii. Pentru a rezolva această ecuație mai trebuie introdusă o condiție: așteptarea numărului de mișcări trebuie să fie finită, adică , , .


Să rezolvăm această ecuație. În ecuația probabilității de pierdere ( ), au fost deja obținute anumite soluții și . Aici apare încă un concurent pentru rolul unei anumite soluții: , prin urmare . Ținând cont de condiția la limită, găsim folosind relațiile obținute anterior : . În cazul unei monede ideale, obținem următoarea expresie: . Aplicarea condiţiei la limită dă: . De aici rezultă că în cazul majusculelor de plecare egale . De exemplu, dacă fiecare jucător are 5 ruble, iar pariul este de 1 rublă, atunci, în medie, jucătorii vor fi frâu după 25 de mutări.

Luând în considerare formulele de mai sus, s-a presupus că așteptarea matematică a numărului de mișcări este finită: . Vom propune acum o dovadă a acestui fapt.

Problema finiturii numărului așteptat de mișcări

Demonstrează că .


Soluţie

Este suficient să dovedim acest lucru pentru cazul (deoarece s-a arătat deja mai devreme că cazurile pot fi reduse la o variație a lui și ) și , și apoi luăm în considerare cazul .

Deci, luați în considerare secvența și introduceți o variabilă aleatoare , unde  este timpul de oprire.

Lasă . Interpretarea este următoarea:  este valoarea mersului aleatoriu în acest moment . Dacă , atunci ; daca , atunci . Amintiți-vă că și demonstrați că .


Pentru a demonstra prima egalitate scriem: . Este destul de evident că , întrucât , la . Rămâne de demonstrat că .

Căci este adevărat că . Ultimul eveniment poate fi reprezentat ca , unde  este un subset al multimii . Acest set este definit numai pentru . Pentru valori mari nu afectează . Setul de vizualizare poate fi reprezentat și ca . Datorită independenței (demonstrată în subproblema 2 ), rezultă că variabilele aleatoare și sunt independente. Prin urmare , datorită faptului că primul factor este zero.

Se stabileste ca pentru o moneda ideala , .

În cazul, există relații (pentru că ) și , din moment ce . Acum să arătăm asta .

În cazul unui joc corect, în virtutea relației , este adevărat că . Atunci , prin urmare . Din inegalitate rezultă că așteptarea matematică converge către valoarea limită . În caz de joc neloial . Deoarece momentul primului zbor al particulei în afara coridorului a fost desemnat ca, așteptarea sa matematică este mai mică decât anumite numere, prin urmare, mai mică decât infinitul. Într-o asemenea condiție .

Simulare pe calculator (metoda Monte Carlo)

Pentru a simula jocul, vom folosi programul MATLAB .

Pentru început, vom genera o secvență și apoi, cu o oarecare bogăție inițială, vom crea un lanț :

Secvența ξ (getXI)

n = 100 _ % Lungimea seriei \xi_i U = rand ( n , 1 ); % Generați 100 de valori aleatoare uniforme [0;1]. XI = zerouri ( n , 1 ); % Rezervă memorie pentru 100 de Bernoulli modificați q = 0,55 ; % probabilitate inversă p = 1 - q ; % probabilitate adversă % Următorul ciclu creează o distribuție Bernoulli bazată pe uniformă [0;1] pentru i = 1 : n % Acest ciclu împarte matricea [0;1] în 2 părți: lungimile q și p, q+p=1 dacă ( U ( i , 1 ) < q ) XI ( i , 1 ) = - 1 ; % Dacă o valoare aleatorie uniformă se încadrează în q atunci \xi=-1 altfel XI ( i , 1 ) = 1 ; % Dacă o valoare aleatorie uniformă se încadrează în p atunci \xi=+1 Sfârşit Sfârşit x = 10 ; % Compensarea bugetului inițial al primului jucător S = zerouri ( n , 1 ); % Rezervă memorie pentru 100 S_1...S_100 pentru i = 1 : n % Faceți seria S_k conform regulii S_{k+1} = S_k + \xi_{k+1} S ( i , 1 ) = x + suma ( XI ( 1 : i , 1 )); % luând în considerare compensarea inițială a bunăstării x Sfârşit

Apoi introducem funcția getS(n, q, x) , care nu doar, ca în listarea de mai sus, ar genera o serie imediat și instantaneu, ci ar permite, pe baza valorilor introduse , să construim o serie într-un mod generalizat fără complicând calculele. Acest lucru ar simplifica spațiul de lucru.

Generarea seriei (funcția getS)

funcția [S] = getS ( n, q, x ) % Această funcție depinde de n, q și x --- 3 variabile U = rand ( n , 1 ); XI = zerouri ( n , 1 ); pentru i = 2 : n % Transformarea distribuţiei Uniform->Bernoulli dacă ( U ( i , 1 ) < q ) XI ( i , 1 ) = - 1 ; altfel XI ( i , 1 ) = 1 ; Sfârşit Sfârşit S = zerouri ( n , 1 ); % Rezervă memorie pentru n S_1...S_n pentru i = 2 : n % Calculați seria S_1...S_n S ( i , 1 ) = suma ( XI ( 1 : i , 1 )); % Însumează \xi Sfârşit S = x + S ; % Adaugă bunăstarea inițială la fiecare S_k din întreaga matrice

Apare o întrebare rezonabilă: de ce să numărați începând doar de la a doua valoare ( pentru i = 2:n )? Faptul este că acest lucru se face exclusiv în scopul vizualizării. La trasarea graficului în codul următor, se vor construi traiectorii , iar dacă pentru i = 1:n s-ar scrie , atunci de la prima valoare ar ieși unele traiectorii din , unele - din . Deoarece în acest program, din motive de optimitate, este mai bine să nu folosiți valoarea zero (particula o părăsește, dar nu este desenată, deoarece adăugarea are loc imediat), pur și simplu deplasăm numerotarea pe axa absciselor cu unu la dreapta. Acum să efectuăm o serie de teste și să luăm în considerare vizual posibilele traiectorii pentru anumite probabilități, durate de joc și număr de jocuri.

Vizualizare (grafice)

N = 3 ; % Număr de jocuri jucate n = 10 _ % Număr de aruncări q = 0,45 ; % șansă ca primul jucător să piardă 1 rublă x = 0 _ % Compensarea inițială a bunăstării matrS = zerouri ( N , n ); % Rezervă memorie pentru N rânduri n matrice cols pentru i = 1 : N % Această buclă umple matricea S cu S_k, dând N traiectorii matrS ( i ,:) = getS ( n , q , x ) ' ; plot ( matrS ( i ,:)); % Oferă o imagine ține - te ; % Ține axele pentru următoarea suprapunere a traiectoriei Sfârşit reține ; _ % Șterge axele pentru o nouă diagramă

Acum să ajungem la cea mai importantă componentă a părții software - un algoritm care ne-ar permite să calculăm durata medie a jocului pentru parametrii dați . Dacă teoria este corectă, atunci experimentul următor o va confirma doar. Vom adăuga, de asemenea, la program o linie care va calcula probabilitatea de ruină a primului jucător ( ) pentru capitalul inițial dat și o va compara cu cel teoretic.

Model de joc complet (Monte_Carlo)

N = 3000 _ % Numărul de jocuri jucate n = 3000 _ % Număr de aruncări q = 0,5 ; % șansă ca primul jucător să piardă 1 rublă p = 1 - q ; % șansă ca primul jucător să câștige 1 rublă A = - 10 ; %1 buget pentru jucător B = 10 ; % buget al doilea jucător x = 0 _ % Buget compensat față de primul jucător Bs = 0 ; % de cazuri de particule lovește B (se va schimba în curând) As = 0 ; % de cazuri de particule lovește A (se va schimba în curând) matrS = zerouri ( N , n ); % Rezervă memorie pentru N rânduri n matrice cols TAU1 = n * unii ( N , n ); % Completați o altă matrice N rânduri n cols cu n pentru i = 1 : N % Această buclă formează N traiectorii ale lui S_k bazându-se pe intrarea q, x, n matrS ( i ,:) = getS ( n , q , x ) ' ; pentru j = 1 : n dacă ( matrS ( i , j ) == A ) || ( matrS ( i , j ) == B ) % Dacă o particulă depășește A sau B, atunci TAU1 ( i , j ) = j ; % pune numărul de pas în tabel Sfârşit Sfârşit plot ( matrS ( i ,:)); % Afișează o cifră grila activata ; ține - te ; % Grafice simultane în cadrul acelorași axe Sfârşit reține ; _ % Șterge axele pentru o nouă diagramă TAU = ( min ( TAU1 ' )) ' ; % TAU = cea mai timpurie etapă a depășirii coridorului [A;B]. % Deoarece [min] afectează coloanele și oferă rând, transpunem TAU1, % minimizați-l pe rânduri și faceți din nou o coloană pentru i = 1 : N % Seriile noastre S_n sunt gata; se cuibaresc in matrS pentru j = 1 : TAU ( i ) % Scanează doar până când întâlnim pasul de evadare! if ( matrS ( i , j ) == A ); % Dacă o particulă a scăpat prin A (primul jucător a fost spart) As = As + 1 ; % apoi adaugă +1 la eșecurile primului jucător elseif ( matrS ( i , j ) == B ) % În caz contrar, dacă primul său prag a fost B Bs = Bs + 1 ; % apoi adaugă +1 la câștigurile primului jucător end % Dacă n nu este suficient de mare, atunci sfârșitul % As + Bs poate să nu constituie N Sfârşit ALPHA = As / ( As + Bs ) % Potriviți alfa cu valorile lor teoretice dacă ( q == p ) TEORALFA = ( B - x ) / ( B - A ) else THEORALPHA = (( q / p ) ^ B - ( q / p ) ^ x ) / (( q / p ) ^ B - ( q / p ) ^ A ) Sfârşit BETA = 1 - ALPHA % La fel pentru beta dacă ( q == p ) TEORBETA = ( x - A ) / ( B - A ) altfel TEORBETA = 1 - TEORALFA Sfârşit meanTAU = medie ( TAU ) % Legea numerelor mari pentru N mari dacă ( q == p ) THEORTAU = ( B - x ) * ( x - A ) else THEORTAU = 1 / ( p - q ) * ( B * THEORBETA + A * THEORALPHA - x ) Sfârşit

Rețineți că, pentru valori mici, nu toate particulele scapă din coridor, așa că aici trebuie subliniat că teoria spune: „pentru suficient de mare , probabilitatea este aproape de ”.

Testare

Următoarele date sunt calculate pentru , .

Testul nr. ALFA BETA înseamnă TAU
unu
2
3
patru
5
6

Experimentele 2 și 3 demonstrează următoarea proprietate: dacă jocul este pierdut pentru primul jucător, atunci creșterea pariului în model este echivalent cu reducerea , și de același număr de ori față de zero. Rata s-a triplat - probabilitatea de a sari din coridor cu valoarea a crescut de 11 ori!

Vezi și

Note

  1. Shiryaev A. N. Probabilitate-1, Probabilitate-2 // Moscova, MTsNMO. — 2007.