Crushing or Crushed

主にShort-handed NLHEで自分が勉強したことについてまとめるブログです。

GTOの体系化を1から考える - 2

お久しぶりです。少し投稿が遅くなってしまいました。

 

今回は前回の記事の続き。この記事を読んでない方はここを先に読むと、以下の議論の理解がスムーズです。

alphanavis.hatenablog.com

背景

「フロップのタイプを固定してもレンジが変わるとお互いのEQも変化する。特定のフロップに対して固定した戦略(例えばすべてのレンジで33%のベット)をとるのは危険」という議論をtwitterで見かけました。これを実際に検証してみます。

前回の記事でもそのことに少し触れていますので、気になる方は上のリンクの5. Range vs Rangeをご覧ください。

 

リサーチクエスチョン

  1. 「フロップのテキスチャーを固定してレンジを変化させると、IPのEQが変化するかもしれない」
  2. 「レンジを変化させてもフロップのテクスチャーによってはIPのEQの変化に差がないかもしれない」

 

実験方法

IP vs BBのレンジ、フロップのタイプを複数用意します。そしてフロップを固定して、各IP vs BBのレンジのEQを計算してその変化を調査します。最後に一つのフロップに対して各レンジに対するIPのEQを計算し、その平均と偏差を求めます。

f:id:alphanavis:20180706090238p:plain

 

フロップが持つ特性を調査するためにクラスタリングという考え方を使いました。

68種類のフロップを5つのEQの特性からクラスタリングします(クラスタリングとは特徴が似たようなものをまとめる手法)。具体的には一つのフロップに対して5つのEQが得られるのでこれを5次元の特徴量として、K-means法を用いて10個のクラスタに分けます。

ペアボード、モノトーンボード、ドライボード、ウェットボードなどのトップダウン的な分類手法は用いていません。

分けたクラスタに対してEQの平均と標準偏差を求め、実際にどのような特徴によってフロップが分けられたかを確認します。

実験の条件

  • 今回使用するのはPioCloudのRake preflop solution
  • IPのオープンサイズは3bbでBBの3-betサイズは10.5bbでお互いのレンジはSingle raised potのものを使用
  • IPのオープンレンジは15%,20%,30%,40%,50%。フロップのサブセットはPIOのpreflop_subsetの68タイプあるものを使用

 

実験結果

           f:id:alphanavis:20180706075604p:plain

上の図が実験結果の概要です。例えばクラスター4はIPのエクイティがOOPに負けているフロップ群です。また標準偏差が1程度であることから、レンジの変化に対してEQの変化が比較的小さいものだということがわかります。

Cluster 4, OOP Favourite Board

f:id:alphanavis:20180706080854p:plain

 

クラスター5はIPに超favouriteなボードだということがわかります。しかし、偏差が4.13と比較的高いことから、レンジの変化に対してEQの変化が大きいことがわかります。要するに、クラスター5に分類されたボード下では戦略(例えばBBの抵抗レンジ)を固定して使うのは危険だということです。これを実際に調べてみました。

Cluster 5, IP Super Favourite Board

f:id:alphanavis:20180706080356p:plain

 フロップの特徴としてはA-high + Pictureか二枚以上のPictureですね。これらのボードに対するIPのEQの平均は58.78%で、IP超有利です。しかし、IPのEQはOPENレンジによって大きく変化することが、標準偏差の大きさからわかります。

AAJ のボードを取り上げてBBの抵抗レンジを見てみましょう。

f:id:alphanavis:20180706081445p:plain

(少し小さいので拡大してご覧ください)

 上の図の抵抗レンジはIPの33%PSBに対するものです。ここからわかるのは

  1. IPのレンジが広くなればなるほどOOPのEQは増加する
  2. UTGに対する抵抗は、9以下のポケットペアは全て降りるバックドアフラドロでもT-high以下は全て降りる。コールはJヒットのみ。後はすべてレイズ
  3. MPに対する抵抗は、ポケットペアをすべてコール(低頻度のレイズ)バックドアフラドロでもT-high以下は全て降りる。ほぼ強いところをレイズ、K-highバックドアフラッシュドローをブラフに入れる
  4. BTNに対する抵抗は、ポケットペアをすべてコール(超低頻度のレイズ)。バックドアフラドロでもT-high以下は全て降りる。レイズ頻度はMPのものとほぼ同じ

 つまりCluster5に分類されるようなフロップでは、レンジによって戦略を変化させる必要があります。

結論

フロップに対するIPとBBのレンジの変化が各プレイヤーのEQに与える影響を検証しました。フロップのタイプによってはEQがあまり変化しないものもあることもわかりました。集合分析する際は、あらかじめレンジの変化によるEQの偏差を確認したほうがいいかもしれません。偏差が大きい場合は、得られたGTOがすべてのレンジで使えない可能性があります。

 

Leftover

今回はレンジ全体のEQを使ってフロップの特徴を調査しましたが、実際は各ハンドのEQの分布が戦略に影響している場合があります。ここを考慮していないので、実験結果が妥当でない可能性があります。次回はハンドのEQ分布を特徴量にしてフロップの特徴を抽出してみたいです。

 

Appendix.

クラスターを張っておきます。興味がある方はご覧ください。右のフロップの特徴は目で見て、何となく傾向をつかんだものです。そうではないものもありますのでご注意ください。

 

f:id:alphanavis:20180706090255p:plain

f:id:alphanavis:20180706090321p:plain

f:id:alphanavis:20180706090333p:plain