Crushing or Crushed

主にShort-handed NLHEで自分が勉強したことについてまとめるブログです。

AKQ GameのEV分布でGTOを学ぶ(前回の続き)

 

alphanavis.hatenablog.com

 の続きを少し短めに。また少し数理的なってしまいますがなるべく要点だけお伝えしていけたらなと思います。

 

1.おさらい

AKQ Gameはリバーのシチュエーションをとても簡略化したものです。

 

OOPの期待値(EV)は以下のように計算されるんでした。

 E_{P_1} = \dfrac{1}{6}bc-\dfrac{1}{3}b(1-c)-\dfrac{1}{6}c+\dfrac{1}{6}b

b = Pr^Q(\mbox{bluff})はIPがQでブラフを打つ確率、

c = Pr^K(\mbox{bluff chatch})OOPがKでブラフキャッチをする確率でした。

AはPure Nuts(100% equity)、KはBluff Cacher(50% equity)、QはPure Air(0% equity)でした。

AKQ Gameはリバーのブラフ率、ブラフキャッチ率の最適な頻度を考えるのに大変良いモデルだと思います。

 

2.EV分布

さて、bc[0,1]の範囲をとりますが、これらを動かしてみてるとOOPの期待値はどのように変化するのでしょうか。見てみましょう。

f:id:alphanavis:20180625034015p:plain

x軸はIPがブラフを打つ確率です(P_2 bet)。y軸はIPがブラフキャッチをする確率です(P_1 call)。z軸がP_1(P_{OOP})の期待値です。例えばIPがすべてのQでベットし( b = 1.0)、OOPがすべてのKでフォールド( c =0.0)する戦略をとっていると、OOPの期待値は約-0.15bb、つまり-15.5bb/100handです。

アグレッションが異常に高い、いわゆるManiacなプレイヤーに対してコールを多めにしなければいけないのはこういうことです。

 

OOPの期待値が0以上になっている点だけを緑の点でプロットしてみると、

f:id:alphanavis:20180625035043p:plain

このような風になります。OOPのはIPのすべての戦略に対して期待値が正になる部分は非常に少ない、言い換えると大変不利だということです。(ポーカーはポジションゲーだということがよくわかります。)

 

3.搾取プレイ

2節ではマニアックに対してコールするという戦略が必要だということをお話ししました。これは搾取プレイに当たります。 b=0.85のIPとプレイしているとすれば、OOPの期待値は以下の水色の線になります。

f:id:alphanavis:20180625035741p:plain

OOPの最適戦略はすべてのKでコールになっていることが図からわかります。大体期待値は0.13bb/handあたりでしょうか。

しかし、IP側がこちらのすべてコールという戦略に気づき始め、ベットする頻度を極端に減らしてきました。 b = 0.25

f:id:alphanavis:20180625035946p:plain

こちらはすべてのKでコールする戦略をとっているため期待値がマイナスになっています(-0.12bb/hand)。これは、IPのブラフ頻度が減ったことにより、相手のベットレンジのナッツ率が上がったためです。

水色線のような P_2ベット戦略のEV分布をみると、傾きがあることがわかります。この傾きがないような戦略がGTOです。傾きがないということは相手がどの戦略を選択しようと、EVが変化しません。

 

4.AKQ GameのGTOとEV

f:id:alphanavis:20180625040631p:plain

前回の記事でそれぞれのGTO

 b=\dfrac{1}{3},c=\dfrac{1}{3}だということを証明しました。上の図はGTOにおけるEVの線分です。どちらも傾きがないことが見てわかります。P_1GTOをプレイしているときの期待値は -\dfrac{1}{18}です。ゼロサムゲームなので、必然的に P_2の期待値は +\dfrac{1}{18}です。

P_2GTOでプレイすれば必ず +\dfrac{1}{18}の期待値が保証されますが、そこから離れてしまうと先ほど説明したように、P_2の戦略によっては-EVになります。

 

青線と緑戦の交点を鞍点(saddle point)と言います。与えられている関数を偏微分することによって求められるのですが、最適化理論によく出てくる話です。

 

5.おわりに

2記事にわたってAKQ Gameを勉強しました。GTOがどういうものなのかを再確認するのにとても役に立ったと思います。あと、ポーカーはポジションが本当に重要だということを実感できました!