エクスプロイトとGTOの枠組み
ゲーム理論、またはGTO(Game Theoretically Optimalの略)は、従うか従わないかの厳格なルールとしてではなく、ポーカーについて考え、相手の行動を予測し、自分の意思決定を改善するためのフレームワークとして理解するものです。その目的は、相手のミスに対する強い思い込みを避け、相手がどのようにプレイしても強い戦略を構築することです。そのため、強い相手とプレイするときはもちろん、ミスを予測しにくい不慣れな相手とプレイするときにも特に役立ちます。
ゲーム理論、またはGTO(Game Theoretically Optimalの略)は、従うか従わないかの厳格なルールとしてではなく、むしろポーカーを考えるためのフレームワークとして理解するのがよいでしょう。
エクスプロイト思考とは、相手が犯すであろう特定のミスを予測し、そのミスを最大限に利用する戦略を考えることです。この思考は、傾向がよく分かっている弱いプレイヤーに対して最も効果的な方法です。
じゃんけんでは、各プレイヤーはグー、チョキ、パーの3つのうち、どれかを出します。エクスプロイト的なアプローチでは、相手が何を出すのか予測し、それに合わせて自分の出す手を選びます。ゲーム理論的なアプローチでは、それぞれ33%の確率でランダムに手を出します。これにより、相手はどの手を出すのか予測不可能になります。
ポーカーでは、これらの枠組みは相互に作用し合っています。実際、ゲーム理論は、より有益な攻略法を編み出すのに役立ちます。例えば、相手がプリフロップで弱いハンドをコールしすぎていることは分かっていても、フロップ後にその弱いハンドをどのようにプレイしてくるかは分からないかもしれません。ゲーム理論は、相手がフロップ後にどのような弱いハンドでプレイしようとも、そのミスから利益を得るのに役立ちます。
ゲーム理論はなぜ役に立つのか
ゲーム理論とは、不確実な状況下で意思決定を行うためのツールです。相手の情報がない場合、ゲーム理論は、相手が可能な限りうまくプレイし、自分の利益を最大限に追求すると仮定します。人間が完璧なプレイをすることはないですが、ほとんどの相手はそれを目指しているので、指針となる他の情報がない場合には有効な仮定となります。
ゲーム理論を理解するための第一歩は、エクスプロイト的な枠組みの外で考えることです。これはベテランプレーヤーにとっては難しいことかもしれません。なぜなら、自分が学んだ、あるいは長い時間をかけて開発した戦略の中に、どれだけ多くの前提が組み込まれているのかに気づかないからです。
多くの場合、これらの仮定は正当なものであり、それに基づいて行動すれば、ゲーム理論の戦略よりも良い結果が得られます。しかし、これらの仮定が「仮定」であることを認識し、適用できないケースで仮定に頼らないようにすることが重要です。
ゲーム理論の実践
エフェクティブスタック100BBのキャッシュゲームで、BTNがJ♥ 9♦でオープンし、BBにコールされたとします。Q♦ 6♥ 5♠のフロップでCベットをし、K♠のターンで大きいベットをします。相手はコールし、リバーは2♣が落ちました。
ブラフをすべきか諦めるべきか?🤔💭
BBがいつもの相手なら、この質問に対する答えは簡単かもしれません。カリムは大きいベットに対してブラフキャッチをしないので彼に対してはブラフ一択です。リンダはブラフされることが嫌いで、相手のカードを見るのが好きなので、ブラフするのはよくないでしょう。
もし相手のことを知らなかったら、「相手がフォールドするつもりなら、ターンで既にフォールドしただろう」とか、「もし相手がコールするほど強ければ、ターンでレイズしただろう」といった経験則に頼るかもしれません。
これらはすべて、エクスプロイト的な意思決定プロセスです。相手の意図を推測し、それに従ってプレイし、推測が正しければ、より利益的なプレイとなります。しかし、間違った推測をした場合、つまりカリムがあなたのブラフにうんざりしていたり、リンダがやめようとしていて大損するリスクを冒したくない場合、たとえ相手が気づいていなくても、相手にエクスプロイトされてしまいます。
エクスプロイトされない、あるいはゲーム理論的なアプローチとは、相手に簡単にエクスプロイトする機会を与えないようにすることです。相手が何をするかを予測するのではなく、自分のプレイを予測不可能なものにし、相手にとって最善のプレイが1つもないようにすることに重点を置きます。
予測不可能とはランダムという意味ではありません。Q♦ 6♥ 5♠ K♣ 2♣のボードで34を持っていたらベットをするべきです。ナッツをチェックすることは確かに予測不可能ではありますが、利益にはなりません。
予測不可能とはランダムという意味ではない。
同様に、K8を持っていたらチェックすべきです。ブラフには強すぎるが、バリューでベットするほど強くはありません。このハンドで予測不可能なことをする必要はなく、ただチェックし、ショーダウンでエクイティを確保するだけでよいでしょう。
適切な頻度と適切なハンドでブラフをすることで、予測不可能になり相手を厳しい状況に追い込めます。
相手は、あなたが強いハンドでは必ずベットし、中程度のハンドでは必ずチェックし、時には慎重に選んだブラフをベットすることを予測できるかもしれないですが、この情報だけでは相手にとってベストなプレイはわかりません。ベットされた時、今回どのタイプのハンドを持っているかは知りません。従って、相手はブラフには勝つが、バリューベットには負けるハンドを持っている場合、勝つ方法はありません。明らかに正しいプレイを相手にさせないようにできています。
以下は、このシナリオにおけるBTNのGTO Wizardのソリューションです。
明らかにベットやチェックを好むハンドもあれば、J♥9♦のように、ベットすることもあればチェックするハンドもあります。これは、相手に対して何も仮説がなかった場合の戦略です。K8と違って、J9には「正しい」プレイはありません。最善のプレイは、この状況でベットするであろう他のすべてのハンドと組み合わせて、ブラフキャッチャーを持つ相手に良い選択肢を与えない頻度でブラフをすることです。
BTNが84%ポットベットをした時のBBの戦略です。K8のようなトップペアでさえ、このベットに対しては良い選択肢がありません。
チェスには「フォーク」という概念があります。相手の駒を1つだけ脅かしても、相手はその駒を安全な場所に移動させればよいので、難しい決断を迫られることはありません。フォークを仕掛ければ、一度に複数の駒を脅かすことができ、相手には魅力的な選択肢がなくなります。相手は1つの駒を安全な場所に移動させることができますが、もう1つの駒を失うことになります。
このリバーベットも同じようなことです。相手がK8をフォールドすれば、ブラフに負けてしまうリスクがあります。相手がコールすれば、バリューベットに負けるリスクがあります。相手に特定の行動を強制することはできませんが、エクスプロイトされないためには、相手に魅力的な選択肢を与えないことで、相手の決断を困難にするようにプレイします。
エクスプロイトされないためには、相手に魅力的な選択肢を与えないことで、相手の決断を困難にするようにプレイします。
インディファレント
上のGTO Wizardチャートにある混合戦略は、難しい決断を表しています。適切な戦略を取れば、相手は利益的なアクションができないようになります。相手が良いハンドを持っているときは、何をしようと相手は利益的なプレイになります。しかし、優れたプレイをすれば、相手の勝ち額を最小限に抑えることができます。
エクスプロイト不可能なプレイとは、2つ以上のオプションが同じEVを持つ場合にのみ、それらのオプションの間で混合することです。どの選択肢も他の選択肢より良くも悪くもない場合、プレイヤーはそれらの選択肢がインディファレントになっています。
エクスプロイト不可能な戦略の目標は、EVを最大化することです。インディファレントとは、その目標を達成するための手段です。相手が特定のミスをすることを想定していない場合、あなたにできる最善のことは、相手が良いプレイをする機会を奪うことです。インディファレントについてはこちらの記事で詳しく説明しています。
エクスプロイト不可能な戦略の目標は、EVを最大化することです。インディファレントとは、その目標を達成するための手段です。
混合戦略対固定戦略
すべてのスポット、すべてのハンドで相手をインディファレントにすることはできません。ベストプレイがある場合、ゲーム理論では相手がそれを見つけると仮定します。このようなベストプレイは、戦略表上では固定戦略として表示され、プレイヤーが毎回取るべき行動となります。エクスプロイト不可能とはランダムという意味ではありません ☝ ‼.
混合戦略は、あるハンドで、あるアクションを取ることもあれば、別のアクションを取ることもあり、プレイを「混合」するものです。対戦相手の戦略についての洞察がない場合、両方(または3つ全部、または4つ全部、または5つ全部)が同じEVを持つこととなります。
頻度の間違い
混合戦略は、その選択が恣意的であることを意味するものではありません。むしろ、正しいプレイは相手の戦略に大きく左右されます。
相手が完璧にエクスプロイト不可能な戦略をとった場合のみ、混合戦略におけるすべての選択肢のEVは同じになります。相手のわずかなズレさえ予測できれば、ある選択肢の方がEVが高くなり、一貫してそれを選ぶべきです。
上記の例では、BBのエクスプロイト不可能な戦略は、このリバーベットに対して48.9%のハンドをフォールドすることです。49%のハンドをフォールドするのであれば、J9でブラフする方がチェックするよりも厳密には有利となります。
毎回J9でブラフすると、自分のエクスプロイト不可能なGTO戦略から逸脱することになります。エクスプロイト的な枠組みの中で、相手のミスを想定しながらプレイすることになります。その仮定が正しければ、有利になりますが、もしそれが間違っていれば、エクスプロイト不可能なブラフの頻度に固執するよりも不利になります。
頻度のミスは相手がエクスプロイトしてくる時に初めてミスとなります。先ほどのJ9でブラフすること自体は悪くありませんが、J9でブラフをする頻度がGTOより高い場合に、エクスプロイト的に高い頻度でコールしてくる相手にはミスとなります。その代わりに相手がエクスプロイト的に高い頻度でフォールドすれば、この「ミス」は利益的なプレイとなります。
もし相手があなたの戦略を知っていたり推測していれば、K8のようなギリギリのハンドでも難しい決断をすることはなかったという意味で、これは間違いとなります。あなたがブラフを多用していることを知っていれば、相手は自信を持ってコールすることができます。
このミスは、よくコールしすぎるプレイヤーにも損失を与えます。このようなプレイヤーは、あなたがミスをしていることに気づかずに、あなたのオーバーブラフのミスから利益を得ています。もしあなたがじゃんけんでいつもグーを出していたら、戦略を知っているプレイヤーに負けるだけでなく、パーを出すのが多いプレイヤーにも負けてしまいます。
純粋戦略のミス
純粋戦略のミスとは、ベットするのに適していないハンドをベットすること(またはチェッ クするのに適していないハンドをチェックすること)です。Q♦ 6♥ 5♠ K♣ 2♣の例では、K8 はブラフをするには強すぎるが、バリューでベットするほど強くはありません。これをベットしても相手に難しい判断を与えることはできません。K8より弱いハンドにはほとんどフォールドされ、強いハンドにはコールされてしまいます。
KKをチェックすることも相手に難しい決断を与えることにはなりません。フォールドしてブラフのリスクを負うか、コールしてこのような強いハンドに負けるリスクを負うか、厳しい選択を迫られるようなハンドが多い中で、安いショーダウンを相手に与えることになります。
頻度のミスとは異なり、純粋戦略のミスは相手の戦略に特に影響されません。このようなミスは、自分ではエクスプロイトしようとしていない相手にも損をします。KKをチェックすると、相手がコールしたであろうバリューを逃してしまいます。K8をベットした場合、ただでショーダウンできたのに、より良いハンドに不必要にお金を失うことになります。
純粋戦略のミスであっても、ゲーム理論の枠組みの中だけのミスです。これらの「ミス」は、理論的には、相手自身が適切な種類のミスを犯した場合、エクスプロイト戦略の有益な部分となり得ます。例えば、多くの弱いハンドでリバーのベットをコールするようなコーリングステーションに対しては、GTO Wizardでは純粋なチェックと表示されていても、K8をベットすることで利益を得ることができます。
ゲーム理論ではこのハンドをチェックする必要はありません。むしろ、そうしなければならない正当な理由がない限り、チェックをするのがデフォルトのプレイだと教えてくれます。
混合戦略には選択肢があり、デフォルトのプレイはありません。相手の戦略についての洞察がなければ、混合戦略の選択肢はどれも等しく優れています。相手がどちらかに逸れるかもしれないという予想さえあれば、他の選択肢よりも1つの選択肢を優先することができます。純粋な戦略から逸脱するためには、相手側がより大きなミスを犯す必要があります。
混合戦略には選択肢があり、デフォルトのプレイはありません。相手の戦略についての洞察がなければ、混合戦略の選択肢はどれも等しく良いものです。
まとめ
ゲーム理論は道具です。どんな道具でもそうであるように、適切な方法で、適切な状況で使えば価値をもたらします。道具を使うためには、その仕組みを理解しなければなりません。
ポーカーの根底にあるゲーム理論を理解していなければ、ポーカーを全く理解していないのと同じです。せいぜい、試行錯誤の末に特定のタイプの相手に有効な戦略を編み出した程度です。よく遭遇するシチュエーションではよいかもしれませんが、あまり馴染みのないスポットでは苦労します。
ゲーム理論を使うといっても、この記事の図表にあるような戦略を完璧に実行する必要はありません。インディファレントという概念を理解し、相手がどのように決断するかを推測するのではなく、相手に厳しい決断を与えるという観点から考えることを学ぶだけで、不慣れな状況をよりよく理解し、パフォーマンスを上げるのに大いに役立ちます。