• 2010-11-15 15:33:45
  • Móriczka és RaiseDave

12. Optimális és exploitív stratégiák

A póker alapvető elemeinek – pot odds, implied odds, ROI, fold equity... - megismesmerése után, megkezdtük egy általános stratégia felépítését – milyen flopokat cbeteljünk, milyen ellenfelek ellen mekkora rangekkel lopjunk vakot, illetve a későbbi utcákon hogyan folytassuk a játékot. Ennek a további részeinek a megértéséhez fontos a stratégia fogalmának pontos ismerete:

Játékelméletben a játékos stratégiája az akciók egy teljes terve minden döntési helyzetre, amikbe a játék közben kerülhet. Egy játékos stratégiája teljes egészében meghatározza az ő viselkedését.

Például 10BB effektív stackel játszunk heads upot, ahol a kisvak vagy allin megy, vagy bedobja a lapját, akkor egy stratégiánk lehet, hogy allinre a {22+, A2+, K5o+, K2s+, Q9o+, Q7s+, JTo+, J8s+, T9s} lapokkal callolunk, minden mást bedobunk. (Ha foldol, úgy megnyerjük a potot) Ezzel minden lehetséges döntési helyzetünkben a lépésünk meghatározott; valóban stratégiát definiáltunk.

Egy stratégia lehet tiszta, valamint kevert. Tiszta stratégiáról akkor beszélünk, ha a stratégiát használó játékos egy szabályrendszer alapján dönti el, hogy melyik lépéslehetőségével él. A stratégiát ismerők számára előre tudott, hogy egy adott szituációból melyik lépés következik.

A közismert kő-papír-olló egylépéses játékban mindössze három tiszta stratégia lehetséges; az első szerint minden lépésünkben követ, a második szerint minden lépésünkben papírt, a harmadik szerint pedig minden lépésünkben ollót mutatunk.

Kevert stratégia esetében minden tiszta stratégiához egy valószínűséget rendelünk (nulla is lehet), ami által a játékos véletlenszerűen használja valamelyik tiszta stratégiát.

A kő-papír-ollóban egy kevert stratégia, ha 50% valószínűséggel követ, 50% valószínűséggel pedig ollót mutatunk.

Játékelméletileg optimális (Game Theory Optimal, GTO) az a stratégia, ami a stratégiák közül a legnagyobb várható értékkel bír, abban az esetben ha ellenfelünk mindig a lehető legjobb ellenstratégiát játsza. Pókerben GTO stratégiát alkalmazva tetszőleges ellenfelek és azok stratégiái ellen soha sem lehetünk hosszútávon veszteségesek. (A raket leszámítva) Továbbá a GTO stratégia sajátja, hogy azt hiába osztanánk meg játékostársainkkal, azt nem tudnák kihasználni ellenünk. (Cserébe mi sem használjuk ki ellenfeleink lehetséges hibáit)

A kő-papír-olló játékban a GTO stratégia, az a kevert stratégia ami szerint 1/3 valószínűséggel követ, 1/3 valószínűséggel papírt, 1/3 valószínűséggel pedig ollót mutatunk. A stratégia várható értéke minden lehetséges stratégia ellen ½.

Exploitív stratégia (kiaknázó stratégia) tetszőleges olyan stratégia aminek várható értéke nagyobb, mint a GTO-é egy adott stratégiával szemben. Maximálisan exploitív stratégia ezek közül a legnagyobb várható értékű.

Ha kő-papír-ollóban ellenfelünk mindig követ mutat, akkor egy exploitív stratégia, ha mi ½ valószínűséggel követ, ½ valószínűséggel pedig papírt mutatunk. A maximálisan exploitív pedig, ha mindig papírt mutatunk.

Ellenfelünk eltér a GTO stratégiától, így hibát követ el, mi pedig azt a hibát (leak) kiaknázzuk az említett exploitív stratégia alkalmazásával (A GTO-nál nagyobb EV-t érve így el). Vegyük észre, hogy így mi is eltérünk a GTO-tól, kiaknázhatóvá válunk, de amíg ellenfelünk nem tér el stratégiájától és nem használja ki hibánkat, addig ezzel nem kell foglalkoznunk. Más szóval a nem kiaknázott hiba az nem hiba.

Exploitálható stratégia (kiaknázható stratégia): Minden GTO-tól eltérő stratégia kiaknázható és ahhoz alkalmazkodva pozitív várható érték érhető el ellene. (Zéróösszegű játékokban)

Előbbi példánkban ellenfelünk exploitálható stratégiát használt, így sebezhetővé vált, mi pedig a megfelelő exploitív stratégiát megtalálva maximálisan kiaknáztuk azt.

A megismert fogalmak együttes bemutatására ismerjük meg a Mike Caro által kitalált AKQ elnevezésű játékot:

  • Adott egy három kártyából álló pakli, ami tartalmaz egy ászt (A), királyt (K) és egy dámát (Q)

  • A játékosok betesznek egy kötelező kezdőtétet (1tét ante), majd 1-1 kártyát kapnak.

  • Egyutcás emelésre van lehetőség (X játékos emel 1 tétet, vagy checkel majd ha emelés volt Y játékos megadja a hívást, vagy dob), utána jön a showdown (ha senki nem dobott), ahol a magasabb lap nyer.

Keressük meg a játékelméletileg optimális stratégiát a játékra! Azonnal észrevehetjük, hogy X játékos A-al mindenképpen hívni fog, K-al pedig semmiképpen hiszen akkor Y-nál vagy A lesz, amivel mindenképpen megadja a hívást, vagy Q amivel pedig biztosan tudja, hogy veszít, így mindig be fogja dobni. Így az Y játékos A-al mindenképpen callol, Q-t pedig mindenképpen bedobja. A kérdés tehát az lesz, hogy X mit fog lépni a Q-val (ekkor Y-nál lehet A amivel mindenképpen callol, viszont a K-át bedobhatja), illetve Y-nak mi a jó játéka K-al. Ha X tiszta stratégiát használ, miszerint A-al hív, minden mással checkel (csak value betel, sosem blöfföl), úgy Y értelemszerűen mindig dobni fogja királyait (sosem bluffcatchel), amire X válasza pedig az lehet, hogy minden Q-t megblöfföl. Az egyensúlyi helyzet, vagyis játékelméleti optimum ezek közt fog elhelyezkedni. A GTO stratégia egy kevert stratégia lesz; X bizonyos frekvenciával meghívja a Q-ját, Y pedig callol K-al.

Jól láthatóan az AKQ játék egy speciális river szituáció analógiája. Az ász reprezentálja a verhetetlen lapot, a nutsot, a király a medium value handet, vagy bluffcatchert (nem dob jobb lap), a dáma pedig az air handet, vagyis a blöfföt. Az optimális river blöff frekvenciát, illetve az optimális bluffcatch frekvenciát keressük. Riveren az optimális blöff frekvenciánk (az összes hívásunkhoz képest) éppen az lesz, amekkora potoddsot az ellenfelünknek kínálunk. Ebből adódóan a védekező éppen akkora frekvenciával callolhat bluffcatcherrel, amekkora potoddsot kap. Az AKQ játékban az anték betétele után a pot nagysága 2 tét, hívásunk 1 tét mértékű volt, vagyis ellenfelünk ¼=25% potoddsot kap. Így river bet „rangeünk” 25%-a lehet blöff, vagyis Q. Ezt pedig úgy érjük el ha a Q-val 1/3 valószínűséggel blöffölünk hiszen így lesz a „rangeünk” ¼ része Q. Hasonlóan Y 1/3 valószínűséggel callol K-al.

Az AKQ játékban a GTO stratégia X számára az, ha A-al mindig, Q-val pedig 1/3 valószínűséggel hív, Y számára pedig, ha A-al mindig, K-al pedig 1/3 valószínűséggel callol.

Ha X exploitálható stratégiát játszik és Q-val sosem blöfföl, úgy Y maximálisan exploitív stratégiája az lesz, ha csak ásszal callol. Illetve, ha X 40%-ban blöfföl, vagyis valamivel többet, mint ahogy azt a GTO szerint tehetné, úgy Y is valamivel többet fog K-al callolni.

Mindannak ellenére, hogy az eddigi példáinkal ellentétben a NL Hold’emben a GTO stratégia a jelenlegi számítógépes kapacitásokkal és algoritmikus ismeretekkel nem határozható meg, annak hasznossága jelentős. Habár a valós pókerszituációk többségében nem célunk GTO stratégiát játszani (minthogy jóval nagyobb profitot érhetünk el ellefeleink hibáinak kiaknázásával), az a maximálisan exploitív stratégiák megtalálásában mégis nagy segítséget nyújt. Miután felmértük ellenfelünk tendenciái, hogyan térnek el a GTO-tól már könnyebben megkaphatjuk a keresett stratégiát. (Az egyszerűség kedvéért GTO-nak tekinthetjük az általunk helyesnek tartott nem exploitív stratégiákat) Nézzünk erre néhány példát!

  1. Ellenfelünk a túl sokat (a GTO-nál többet) dob vakokból lopás ellen

->Több lappal támadjuk meg a vakjait minden pozícióból.

  1. Túl sok lappal támadja a vakokat

->Szélesebb rangel védjük vakjainkat, mind visszaemelés, mind coldcall formájában.

  1. Openlimpeléssel avatkozik játékba

->Izoláljuk különösen tág rangel pozícióból. (Emeljünk rá)

  1. A GTO-nál tágabb (gyengébb) rangel izolálja a limpelőket.

->3beteljük gyakran minden pozícióból. (A játékos a limpelőt tudatosan exploitálja ezzel magát sebezhetővé téve, ha a limpelő nem is változtat a stratégiáján, a többiek számára exploitálhatóvá válik)

  1. Túl sokat cbetel, nem megfelelő flopokat is

->Raiseljük többet a cbetjét és adjuk meg gyenge drawkal is a kassza turnon való megnyerése céljából. (float)

  1. Túl sokat raiseli, vagy checkraiseli a cbetjeinket

->Kevesebb lappal cbet blöfföljünk, illetve a GTO-nál gyengébb drawkal is 3beteljünk a flopon (nagyobb az FE).

  1. Sosem raiseli, vagy checkraiseli blöffből a hívásainkat

->Húzólapjainkal nagyobb implied oddsra és kisebb fold equityre számíthatunk, így több drawval játszhatunk ellene mégpedig megadással.

  1. Túl sokat barrelezik a turnon airrel, illetve gyakran meghívja medium value handjeit (ritkán pot controllál)

->többet bluffcatcheljünk, tágabb rangel bluffraiselhetjük a turnt, valamint húzólapjainkal inkább a turnon emeljünk a flop helyett.

Az előző cikk gyakorlatainak a megoldása:

lapunk

flop

turn

pos

E

ellenfél

mennyi

draw (kb)

blöff

frekvencia

scare-

cardok

Megoldás

QdJd

JhTc5h

Ts

IP

10-24%

50%

30%

11 (3Q,4A,

4K)

Elnfelünknél nagyon sok draw lehetséges, de a turn tízes miatt turnon nem nagyon kapnánk sok rosszabb laptól callt, így viszonylagosan magas blöff frekvecnia miatt checkbackelnünk kell a turnt és riveren callolni esetleges hívását.

Tc9c

Ts6h2s

Jh

IP

10-24%

35%

35%

12
(4A,4K,

4Q)

Ellenfelünknek nagyon sok draw van a rangében, de rosszabb lapoktól nem nagyon kaphatunk callt, így a CHEK a megoldás és riveren ha hív, akkor call a magas blöff frekvencia miatt és esetlegesen riveren könnyebb megadást kapjunk gyengébb lapjaitól (77-99,67s)

Tc9c

Ts6h2s

Jh

IP

10-24%

35%

0%

12

Ugyanaz áll fent mint az előzőnél, csak itt ellenfelünk sohasem fog blöffölni riveren és kizárt, hogy gyengébbet valuebeteljen így ha riveren hív dobnunk kell.

As9s

Ah7s8s

Tc

OOP

4-12%

25%

15%


CHECK. Top párunk van flushdraw-val, valamit oesd-vel és nem szeretnénk esetleges raise-t kapni, valamint a range igencsak tartalmaz jobb ászokat, így pot controll check/call turnon, ha riveren nem javulunk, akkor c/f.

As9s

Ah7s8s

Ac

OOP

4-12%

25%

25%


A flop call range itt ellenfelünknek Ax, drawk illetve mid párok, a turn lejövetelével csökkent a valószínűsége, hogy a lenne nála, de ezen a turnon a közepes párjaival és a 8x handjeivel még tovább adhat és riveren az összes broadway kártya esetlegesen elriaszthatja. BET

Pontok: 4.8 (pontozók száma: 25)
    SH Pókersuli XII. - Optimális és exploitív stratégiák
    10
    2010-11-18 09:39
    Sziasztok!

    Most regeletem az oldalra, de minden cikketeket elolvastam, és az kell mondjam az összes magyar oldalon megjelenő cikkek/ sorozatokhoz hozzátok képest a béka se**e alatt van. NAGYON NAGY GRATT! És alig várom a következő!
    9
    2010-11-17 10:41
    Ez a játékost tendecniáinak megfigyeléséből lehet körülbelül megállapítani, hogy hogyan épül fel a range, mennyi busted draw lehet ebben a rangeben és abból mennyit fog megblöffölni. (például a river agresszió faktor és frekvencia jó kiinduló pont lehet)
    8
    2010-11-17 08:17
    Még egy kérdésem lenne az előző rész feladatainak megoldásaihoz. A bluf frekvencia értéke hogyan, milyen értékből számítható-becsülhető?
    7
    2010-11-16 09:39
    Köszönöm! Így már értem.
    6
    2010-11-16 09:29
    Két játékos van csak.
    5
    2010-11-16 09:10
    Bevallom, engem ez az AKQ példa zavart a leírtak az értelmezésében.

    Ha 3 lapos pakliból 3 ember kap 1-1 lapot, és nincs nincs nálam az A, akkor 100% hogy valakinél ott van. Tehát semmi értelme emelni vagy megadni, ha K vagy Q van nálam. Vagy nem? Vagy nem értem??? :)
    4
    2010-11-16 00:47
    Thx!

    GG :d
    3
    2010-11-15 20:45
    Grammar náci leszek: rengeteg az elírás!
    ----------

     

    2
    2010-11-15 17:40
    Kiváló ,lényegre törő ,remekül szemléltető cikk!!!GRAT
    Egy kő, papír, ollós videót is csinálhatnátok hozzá!!!!!
    ----------

     Ha sem magadat, sem az ellenséget nem ismered, minden csatában alulmaradsz.

    1
    2010-11-15 17:19
    Fantasztikus cikk :)