Mi
is az a szórás, és miért érdekes a pókerben?
A pókerben elért nyereséget BB/100 mértékegységben adjuk meg, ami a 100
leosztásonként megnyert (vagy elvesztett) átlagos big bet (nagy tét). Egy 2/4
dolláros asztalon a nagy tét 4 dollár.
Adva van egy játékos, aki hosszabb távon átlagosan 2 BB/100
teljesítményt nyújt. Ez azonban nem azt jelenti, hogy
Kicsit
részletesebben
Hogy megértsük a dolgot, vegyünk egy hétköznapi példát. Nézzük meg azt, hogy egy adott nagyvárosban a 30-40 közötti
korosztálynak mekkora az átlagmagassága. Nyilván ki fog jönni egy átlagos
magasság, mondjuk 172.3 cm. Ez persze nem jelenti azt, hogy kivétel nélkül
mindenki pontosan ilyen magas. Ha azt ábrázolnánk, hogy az egyes magassági
tartományokba (160-165, 165-170, 170-175 stb.) hányan tartoznak, akkor egy
ilyesmi görbét fogunk kapni:
A vízszintes tengelyen vannak a magassági kategóriák, a
függőlegesen pedig hogy melyikbe hány ember tartozik. Ez a
görbe a haranggörbe vagy Gauss-görbe, ami egy ún. sűrűségfüggvény. A természetre általában jellemző ez az
eloszlási mód. Ha ábrázoljuk egy adott napon egy adott városban az átlaghőmérsékletet, vagy hogy egy adott közösségben az
emberek hány éves korukban vesztik el a szüzességüket, akkor valami ilyesmit
fogunk eredményül kapni. Ez az ún. normális
eloszlás.
(Vannak
persze másféle eloszlások és sűrűségfüggvények is. Ha kockával dobunk és azt ábrázoljuk hogy hányszor volt 1, 2, 3, 4, 5 vagy 6 az
eredmény, akkor egyenletes eloszlást kapunk, mert mindegyik eseménynek pontosan
ugyanakkora a bekövetkezési valószínűsége. Ennek a görbének a
körvonala egy doboz lesz.)
Mit
mond nekünk a sűrűségfüggvény?
A
haranggörbe alakja azt, hogy a legtöbben az átlag
környéki magasságúak (ott van a csúcs), és minél jobban eltér a magasság az
átlagtól annál kevesebben tartoznak oda (a szélek felé csökken). A görbe
csúcspontjának a helye normális eloszlás esetén pontosan az
átlagra esik.
A
görbe kövérsége vagy szélessége megmondja, hogy mennyire nagy a szórás,
azaz mennyire valószínű, hogy valakit találomra kiválasztva az az átlagtól
nagyon eltérő magasságú lesz. Átlagos populációnál elég
széles görbét kapunk. Profi kosárlabdajátékosokat nézve a görbe nem csak
hogy jobbra (a magasabb kategóriák felé) eltolódik, de egyúttal sokkal
keskenyebb is lesz kevés a törpe termetű kosaras, de három méteresből sincs
sok.
A képen látható görbe szimmetrikus. Ha nem az
lenne, akkor a deformáció mértékét az ún. skewness
jellemzővel lehetne leírni, ami a tökéletesen szimmetrikustól való eltérés
mérőszáma.
A
szórás a pókerben
Ha
feltételezzük, hogy a pókerben az eredmények eloszlása
normális eloszlást követ, akkor a szórás mondja meg, hogy mekkora kilengésekre
számíthatunk.
Egy
rock stílusú játékos esetén, aki kerüli a kockázatos helyzeteket, és csak a
biztosra megy be, és csak ritkán (a nut lapokkal) emelget, annál a szórás kicsi
lesz. Nem fog sokat veszteni, de nem is fog sokat nyerni.
Laza-aggresszívnél, mániákusnál a szórás nagy lesz. Hol
nagyon sokat veszít, hol nagyon sokat nyer.
Egy
feszes-aggresszív játékosnál a szórás valahol az előző
kettő között várható. Többször és többet veszít mint a rock, de többször és
többet is nyer annál.
Mint
a példákból is látható, minél lazábban és minél aggresszívebben játszik valaki,
elvileg annál nagyobb szórásra számíthat. A szórás ezen túlmenően az
asztalnál ülő többi játékostól is függ: ha van egy mániákus, az pl. jelentősen
megnöveli a szórást; az állandó emelgetése miatt vagy sokat nyerünk, vagy sokat
vesztünk.
A Poker Tracker és a szórás
A Poker Tracker programban a szórást a következőképpen lehet megnézni:
Ring game statistics modul à Session
notes lap à Katt a More
detail gombra (jobbra felül).
A megjelenő lapon alul a Standard Deviation/100 Hands értéket kell nézni.
A szórást a következőképpen számolja a PT:
1. Kiszámolja az átlagos BB/100-at a teljes vizsgált időtartományra.
2. Felosztja a tartományt 100 leosztásos session-ökre. Minden egyes ilyen
session esetében veszi az ott meghatározott BB/100 értéknek az 1. pontban
kiszámolt átlagos BB/100-tól való eltérésének a négyzetét.
3. Ezeket a négyzeteket összeadja.
4. A kapott négyzetösszeget elosztja a session-ök száma mínusz 1-gyel
5. Végül ennek veszi a négyzetgyökét.
Ez a szórás kiszámításának az általános algoritmusa, a képlete:
SD = [S (xi-A)2/(N-1)]1/2
Ahol:
A: az átlag
N: a számosság
(Megjegyzés: előfordul, hogy N-1 helyett Nel osztanak, de ez kellően nagy
mintaszámnál nem befolyásolja jelentősen a végeredményt.)
A jellemző szórás
A 2+2 fórumosok körében végzett felmérés azt mutatta, hogy a 9-10 fős
asztalokon játszó limit játékosok körében az SD általában 15 BB/100, a
shorthanded (5-6 fős) limitesek esetében pedig 16-17
BB/100.
A
konfidencia intervallum
mit várhatok a következő 100 leosztás során?
A
gyakorlatban felmerülhetnek ilyen kérdések: ha találomra kiválasztunk egy
embert, akkor az esetek 66%-ban milyen magassági
tartományba fog esni? Hány éves csajokra kell ráhajtani, ha
99.7%-ig biztosak akarunk lenni abban, hogy kifogunk egy olyat, amelyik még
szűz? A póker esetében, mekkora az a BB/100
tartomány, amibe az esetek 95%-ban bele fog esni a nyerésünk? Ezek az ún. konfidencia-intervallumok. A kifejezés szó szerint lefordítva megbízhatósági intervallumot
jelent.
A
konfidencia intervallumokat az átlag plusz/mínusz 1, 2
vagy 3 szórásra szokták meghatározni. Normális eloszlás esetén:
-
99.7% a valószínűsége annak, hogy egy eredmény az
átlag +/- 3 SD tartományon belülre esik.
-
95% a valószínűsége annak, hogy egy eredmény az átlag
+/- 2 SD tartományon belülre esik.
-
66% a valószínűsége annak, hogy egy eredmény az átlag
+/- 1 SD tartományon belülre esik.
Például: ha 2 BB/100 a nyerési rátánk, és 15 az SD, akkor a következő
100-as session-ben 66% a valószínűsége annak, hogy a nyereményünk 13 (2-15) BB
és 17 (2+15) BB között lesz. 2/4 alapon ez -$52 és +$68 között várható
eredményt jelent. 34% a valószínűsége annak, hogy vagy
17 BB-nél többet nyerünk, vagy 13 BB-nél többet vesztünk.
A standard hiba mit várhatok hosszabb távon?
A standard hiba (standard error, SE) az átlag körüli variancia másik
mérőszáma.
SE = SD / SQRT( mintaszám )
Mint a képletből is látható, minél nagyobb a mintaszám, annál kisebb a
standard hiba, tehát annál pontosabban be lehet határolni a várható kilengést.
Az SE és az SD közötti különbség az, hogy míg az SD arról ad felvilágosítást
hogy a következő mintánál (100-as session) milyen BB/100-at várhatunk, addig az
SE azt mondja meg, hogy a következő, ugyanakkora számosságú sorozatnál mit
várhatunk.
Példa:
100 000 leosztás van az adatbázisomban, a nyerési
rátám 2.2 BB/100, az SD = 15.15 BB/100.
3
* SE = 3 * 15.15 / SQRT( 100 000 / 100 ) = 1.4
Ez
azt jelenti, hogy a 99.97% a valószínűsége annak, hogy a következő 100 000
leosztás során a nyerési ráta valahol 2.2 - 1.4 = 0.8 és 2.2 + 1.4 = 3.6 BB/100
közé esik. Mint látható még 100 000 leosztásnál is elég nagy a bizonytalanság.
Ha csak 10 000 leosztásunk lenne, akkor a tartomány ‑2.3 és +6.7 BB/100
közé esne! Ezért mondjuk azt, hogy a pókert hosszabb
távon szabad csak nézni, soha nem rövid távon. És 10 000 leosztás az bizony még nem hosszú táv.
Másik
példa: 27 000 leosztás van az adatbázisomban, a
nyerési rátám 4.7 BB/100, az SD = 17.5 BB/100.
3
* SE = 3 * 17.5 / SQRT( 27 000 / 100 ) = 3
Ez
alapján:
99.97%-ig
biztos, hogy a hosszú távú nyerési rátám 1.7 BB/100 és 7.7 BB/100 közötti
95%-ig
biztos, hogy a hosszú távú nyerési rátám 2.7 BB/100 és 6.7 BB/100 közötti
66%-ig
biztos, hogy a hosszú távú rátám 3.7 BB/100 és 5.7 BB/100 közötti
A t-teszt tényleg nyerő játékos vagyok-e?
Ez a kérdés mindenkit érdekel aki pókerezik,
hiszen tudjuk, hogy az aktuális nyerés vagy vesztés nagymértékben a
szerencsének (lapjárás) is köszönhető. A kérdés megválaszolására a W.S. Gossett féle "one-sample
one-tailed t-test" használható. Ezt eredetileg a Guinness-sörök
gyártásánál használt sörélesztő minőségének tesztelésére dolgozták ki, de most
már ennél jóval szélesebb körben is használják. A matematikai részletekbe most
ne menjünk bele. Az alábbi táblázatból kikereshető annak a valószínűsége, hogy
valóban nyerő játékosok vagyunk-e:
Win 75% 80% 85% 90% 95% 99%
0.5 467 726
1101 1683 2772 5545
1.0 117 182
276 422
694 1389
1.5 52 81
123 188
310 619
2.0 30 46
70 106
175 350
2.5 19 30
45 69
113 225
3.0 14 21
32 48
79 157
3.5 10 16
24 36
58 116
4.0 8 12
18 28
45 90
Példa a használatra: ha a jelenlegi átlagunk 3 BB/100, és azt akarjuk
tudni, hogy mekkora a valószínűsége annak, hogy tényleg 2 BB/100 fölöttiek
vagyunk. A kettőt ki kell vonni egymásból, ez 3 2 = 1. Ha 95%-os bizonyossággal
akarjuk ezt tudni, akkor az 1.0 sor és a 95% oszlop
metszéspontjában található számot (694) szorozzuk meg ezerrel (694 000). Ennyi
leosztásra (mintára) van legalább szükség ahhoz, hogy 95%-ig biztosak lehessünk
abban, hogy tényleg 2 BB/100 fölött teljesítünk.
A táblázatból látható, hogy minél kisebb bizonyossággal akarjuk tudni, és
minél nagyobb különbséget elfogadunk jelenlegi nyerési rátánkhoz képest, annál
kisebb mintaszámra van szükség. És fordítva: minél kisebb a mintaszám, annál
nagyobb bizonytalansággal tudjuk csak megmondani a valódi nyerési rátát. 12 000
leosztás esetén például csak 80%-ig lehetünk abban biztosak, hogy a hosszú
távú, valódi nyerési rátánk nem tér el 4 BB/100-nál jobban az eddigi
átlagunktól. Ugyanakkor 5 és félmillió leosztás kell ahhoz, hogy 99%-os
biztonsággal mondhassuk, hogy a nyerési rátánk nem tér el 0.5
BB-nél nagyobb mértékben az eddig átlagunktól.
Ha az SD jelentősen eltér 16-tól, akkor a fenti tábla kissé inadekvát lesz,
de minél több leosztást nézünk ez annál kevésbé lesz szignifikáns.
... fenntartásaim
Először
is, én a magam részéről én nem vagyok abban biztos,
hogy a pókernyeremények eloszlása normális eloszlás. Mindazonáltal
ezt a témát még nem kutatták a
tudósok, úgyhogy jobb híján tételezzük fel, hogy ez a helyzet. Valószínűleg
nem tévedünk nagyot. Biztosabbat csak akkor tudnánk mondani, ha a PT (vagy egy
másik hasonló program) ábrázolná a session nyerések sűrűségfüggvényét. Ha az
tényleg szabályos, szimmetrikus haranggörbe a legtöbb játékosnál, akkor már
megalapozottan mondhatjuk, hogy normális eloszlásról van szó. (Én úgy gondolom,
vagy hogy stílszerű legyek: arra fogadnék, hogy a skewness effektus nagyobb
szerepet játszik, mint gondolnánk.)
Aztán, a fenti számítások, mint minden efféle statisztika, csak akkor igaz,
ha sem a mi játékunk, sem az ellenfeleink játéka a vizsgált időszak alatt nem
javul vagy romlik jelentősen.
Végül pedig, a fentiek csak egyetlen tényezőnek, a BB/100-nak a tiszta
matematikai elemzései, és a többi paraméter nincsen benne. Mondjuk
van két játékos, egyformán 20 000 leosztással, 2 BB/100-zal és egyforma
szórással. Ha az egyik feszesen indul, helyesen játssza le a lapjait
és ritkán megy tiltre, akkor én bizonyos vagyok abban, hogy az tényleg nyerő
játékos. Ha a másiknak 40%-os flopnézése van, akkor lehet akármekkora a BB/100
meg a szórása, az nem lehet hosszabb távon nyerő játékos.
Tannhauser