GTOソリューションは、相手がどのようなプレイをしようとも、それなりに上手くプレイすることができ、エクスプロイトされないように設計されています。これは、最善のアクションがある場合、相手がそのプレイをすると仮定することで達成されます。つまり、GTOとは相手の利益を最小限に抑える方法でプレイすることです。
言い換えれば、GTOソリューションは、相手が犯すであろうミスを想定したり、それを狙ったりはしません。そのため、相手がどんなに予測不可能な戦略を仕掛けてきても、それに対抗することができます。GTO戦略は多くの一般的なミスから利益を得ることができますが、相手が犯したミスから最大限利益を得ることはできません。
GTO戦略は多くの一般的なミスから利益を得ることができますが、そのようなミスを最大限に利用するように設計されたエクスプロイト戦略ほど利益を得ることはできません。
相手のミスを特定できる場合、そのミスにつけ込むために、エクスプロイト不可能なプレイから変えるべきです。これはGTOを放棄しているわけではありません。ソルバーにミスを教えると、ソルバーもそのミスにつけ込むため戦略を変更します。(これはノードロッキングによって可能です)。
混合戦略と感覚
GTO戦略のある部分は、他の部分よりも相手の反応に繊細です。例えば、BTNでAAをレイズすることは、100bbのキャッシュゲームだとブラインドに誰がいようとも確実に正しいプレイとなります。同じスポットで72oをフォールドするのも、BBのプレイヤーがよほど大きなミスをしない限り、正しいプレイとなります。しかしA3oやT4♠のようなハンドはブラインドの反応次第でどちらに転ぶかわかりません。
どうしてでしょうか?下記のBTNのオープンレンジをみてみます。各ボックスの右下の数字は、相手が完璧に反応した場合のハンドのEVです。
ハンドによっては少しの違いで利益を生むかどうか変わってきます。AToとJ8♠は均衡において利益が出るオープンであり、ブラインドがどう反応しても利益が出ます。ブラインドがソルバーより多くコールや3ベットをしたとしても、これらのオープンは利益を生みます。逆に、72oは利益を生むオープンとは程遠く、ブラインドがコールや3ベットを多少少なくしても、利益を生む可能性は低いでしょう。
しかし、多くのハンドは、均衡時のレイズとフォールドのEVは同程度です。つまり、相手が完璧な戦略をしなければ、どちらかの選択肢が優位になる可能性があります。どのような混合戦略でも、混合されたすべてのアクションのEVは同じでなければならなりません。もしそうでなければ、ソルバーは一方のアクションを他方のアクションより好むことになります。つまり、相手とのわずかな乖離が、一方の選択肢をより有益にする可能性があります。
しかし、純粋戦略も変わることがあります。完璧にプレイするブラインドにT4♠をオープンした場合のEVは-0.01bbに過ぎないので、ブラインドが頻繁にフォールドしたり、3ベットが少なかったりして、ソルバーが予想する以上のエクイティが実現できれば、これは利益を生むオープンになる可能性があります。逆に、ソルバーがオープンするとしたT6♠でさえも、3ベットを頻繁にするブラインドに対しては利益が出ず、フォールドになる可能性があります。ハンドのEVが0に近ければ近いほど、後ろのプレイヤーの反応次第でEVが変わります。
4段階のエクスプロイトプロセス
著著『Play Optimal Poker』では、エクスプロイト思考のための4つのステップを推奨しています。
1)均衡を思い描く
“もし相手と自分がGTOを正確に実行できるスーパーコンピューターだとしたら、このハンドはどのようにプレイされるだろうか?”と自問します。人間はスーパーコンピューターではないので、正確に実行することはできないですが、以下のような要素を考えます。
- どちらのプレイヤーがベットをしそうか
- 各プレイヤーはどのようなレンジでベットするべきか
- 各プレイヤーがバリューベットするのに最適なハンドは何か
- ベットした場合、相手のレイズレンジはどうなるか
- 相手が全スタックを賭けるべき最も弱いハンドは何か
相手の均衡戦略がどのようなものであるべきかという感覚を持てば、相手がそこからどのように逸脱する可能性が高いかを想定しやすくなります。そうすれば、その乖離をどうエクスプロイトするかを考えることができます。
相手の均衡戦略がどのようなものであるべきかという感覚を持てば、相手がそこからどのように逸脱する可能性が高いか想定しやすくなります。
ゲーム理論が初めての人にとって、これはおそらく全過程の中で最も難しいステップです。たとえ大まかな輪郭(「私はほとんどチェックすべきで、相手はほとんどベットすべきだ」)しか想定できなかったとしても、均衡についてまったく考えないよりは大きな進歩です。練習や経験、勉強を重ねることで、均衡をより正確に思い描けるようになります。
2) 相手の戦略を考える
“相手はどのように均衡から逸脱しているのか?“と自問すること。これを明確に、できるだけ具体的に。”彼らはルースすぎる “や “彼らは魚だ “ではなく、”彼らはリバーでブラフキャッチャーで頻繁にコールしすぎる “と考えるようにします。勘でもいいので、考えることが重要です。ポーカーは基本的に、不確実な状況下で決断を下すゲームです。
3) エクスプロイトの特定
均衡戦略から逸脱しそうなものを見つけたら、”このミスをエクスプロイトするためにはどうすればいいか?”と自問します。ここでも、できる限り正確かつ具体的に答えを出します。また、1つのミスに対して複数のエクスプロイトの可能性があることも多いので、クリエイティブになることが重要です。
4) 乖離の程度を判断する
どこまで均衡を保つべきか?
相手がリバーで十分なブラフをしないようなので、フォールド頻度を増やして相手をエクスプロイトしようと考えたとします。次のステップは、どれくらいの頻度でフォールドするかを決めることです。フォールドする頻度とは、判定が僅差になりそうなときにフォールドすることだけを指すのだろうか?セカンドナッツをフォールドするのと同じくらい極端なのか?それともその中間か?
ブラフを見つけるのが難しいリバーもあれば、そうでないリバーもあります。しかし、相手のミスの大きさと、自分の読みに対する自信の度合いという2つの要素を事前に考慮することができます。均衡戦略から逸脱しているように見える相手をエクスプロイトするためには、自分も均衡戦略から逸脱しなければいけません。これは逆に、自分の読みが間違っていた場合にエクスプロイトされる可能性を高めることになります。
均衡からの乖離が大きければ大きいほど、間違った場合のペナルティは大きくなる。
実戦
22223のボードで単純化したシナリオを考えてみます。IPのレンジは44-AAで、OOPのレンジは77-JJです。ポットは$100です。IPは$100をベットするかチェックします。ベットした場合、OOPはコールしてもフォールドしてもよいです(ベットやレイズが許されたとしても、絶対にしないでしょう)。
IPの均衡戦略またはGTO戦略は、JJ以上のものをベットし、OOPがブラフキャッチャーでインディファレントなるような頻度で、44、55、66(どれも等しく無価値なのでどれでもよい)をブラフをします。
バリューベットはすべて純粋戦略であり、ベットする方がチェックするよりも断然有利です。最も薄いバリューベットであるJJでさえ、ベットすることで$133.92を稼ぎ、チェックは$98しかプラスではありません(OOPのJJとチョップすることもあるため、チェックしてもポット全額を獲得することはない)。
ブラフはすべて混合戦略なのでベットとチェックは同じEV、この場合は$0でなければならなりません。
OOPがIPのブラフをインディファレントにするためには、コール頻度が50%である必要があります(ここではJJによるブロッカー効果があるため、ごくわずかに少ない)。JJはIPのバリューベットの一部をブロックするので、利益を生むコールであり、残りはブラフキャッチャーであり、コールするかフォールドするかはインディファレントとなります。
両プレイヤーのエクイティは50%で、このゲームでのIPのEVは$67.70で、$50ポットの半分をはるかに超えています。OOPが可能な限り良いプレイをしているにもかかわらずIPが有利になっています。ポラライズレンジでベットすると、相手がどう反応しようとも、利益的なプレイとなります。
OOPの戦略をノードロックし、50%ではなく52%の頻度でコールするようにしたらどうなるでしょうか。この少し緩すぎるコール戦略をエクスプロイトするために、IPはどのように戦略を変えるのでしょうか。全く変えないのか、ブラフを少し減らすのか、それとも劇的に減らすのか。
OOPのコール頻度がごくわずかに増えたことで、IPはブラフを完全にやめます!これらの混合戦略はすべてOOPの反応次第ですぐに変わります。純粋戦略はどれも変わっていません。TTは依然としてチェックが最もEVが高いですが、これは均衡時に特に接近した決定ではなかったからです。
OOPを100%コールするコーリングテーションに変えると、TTはIPにとってバリューベットになりますが、99は依然としてチェックするのが最も高いEVとなっています。
相手のミスをエクスプロイトする場合でも、基本戦略やGTO戦略のアイデアから始めるのが有効です。その戦略のどの部分が相手の反応に最も左右されるかを理解すれば、その反応をどのように逸脱してエクスプロイトするかについて、より情報に基づいた有益な決断を下すことができます。
最初の方のストリートでの適応
相手が後のノードでミスをすることが予想される場合、後でそのミスから利益を得ることを期待して、前の方のストリートから戦略を変えたほうがよい場合があります。
ある相手がターンで頻繁にコールしすぎることがあったとします。ターンでのブラフを減らすことは明らかなエクスプロイトのように思えますが、もし相手がリバーでフォールドしすぎていたらどうなるでしょうか。その場合、後で取れるポットが大きくなることを期待して、ターンでのブラフを多くする方がよいかもしれません。
同様に、相手がリバーでブラフを多くする場合は、そのことをターン(およびそれ以前のストリート)の判断にも反映させるべきです。ほとんどの場合、リバーでのブラフキャッチによる利益を期待して、よりターンでコールするようになります。しかし、自分のハンドがリバーでコールするのに特に適していない場合、たとえGTOではコールで利益が出るハンドであっても、ターンですぐにフォールドした方がよいでしょう。このようなハンドに対するGTO戦略は、この相手から予想されるよりも、リバーでチェックやショーダウンをすることを想定しています。
このようなエクスプロイトは、プリフロップの判断にまで遡ることができます。ポストフロップでの相手のミスが多ければ多いほど、そのミスから利益を得るために相手と頻繁に戦うようになります。しかし、ここには大きな注意点があります。
マルチウェイポット
フロップの前や、複数のプレイヤーがまだ残っている時は、特定の相手をエクスプロイトすることが難しくなります。
プリフロップでBBが小さいレイズにフォールドしすぎるニットであることが分かっていたとします。もし9人テーブルでUTGだとしたらごくわずかにオープンレンジを広げることができるかもしれないですが、それでも他の7人のプレイヤーがコールや3ベットをしてくるかもしれないので、あまり広げすぎることはできません。
もし他のプレイヤーがフォールドしてBTNでアクションが回ってきたら、ブラインドのプレイヤーだけがオープンレンジを広げるかどうかの要因となるため、より多くのハンドをオープンすることができます。それでも、SBからの3ベットの脅威、特にBBがタイトな場合、SBがオープンレンジを広げることを予期していたような優れたプレイヤーであった場合には、多少制約を受けることになります。
同様の動きはポストフロップでも起こります。UTGがオープンし、あなたがBTNでコール、BBもコールしたとします。UTGは素直すぎるプレイヤーで、フロップ後は確実に強いハンドをベットし、弱いハンドをチェックします。BBはタフで優れたプレイヤーであり、UTGのミスやそれに対するあなたの適応策に気づいています。UTGがチェックした場合、UTGからのフォールドエクイティを得るために、GTO戦略よりもいくらか多くベットしたいですが、BBがコールしたりチェックレイズしたりすることもいくらか多くなると予想すべきです。プリフロップの例と同様、自分とBBは互いにエクスプロイトされることなく、UTGのミスを突くことができます。UTGが賢くなり、強いハンドをチェックしたり、ブラフをチェックレイズしたりした場合、自分達2人をエクスプロイトする可能性があるのはUTGです。
後者のケースは、GTOとエクスプロイトの融合と考えるのが最も適切で、自分とSBは互いにバランスを保ちながら、BBのミスに順応してポットの分け前を多く要求することになります。この場合、自分はやや広めにオープンし、SBはやや広めにコールと3ベットをし、自分はやや弱いハンドでその3ベットをコールまたは4ベットすることになります。BBのミスにより、自分とSBは互いにエクスプロイトされることなく、より多くのハンドをプレイできるようになり、新たな均衡が生まれます。自分の逸脱から利益を得ることができるプレイヤーはBBです。もしBBが何が起こっているかに気づき、自分のコール、3ベット、4ベットの頻度を増やせばエクスプロイトされてしまうでしょう。