ポーカーにおける誤解されやすい用語に「インディファレント」という言葉があります。
インディファレントとは2つ以上のアクションが同じ価値を持つことを指します。インディファレントにプレイすることを学ぶのは、ポーカーの理論を学ぶ上でとても重要です。
GTOソリューションの解釈は、科学というよりも芸術に近いかもしれません。直感と科学的な分析を組み合わせた主観的なものが多くあります。GTOポーカーには経験則や多くの場合に当てはまる法則のようなものはたくさんありますが、絶対に正しい法則はほとんどありません。しかし、インディファレントについては絶対的な法則があるので、そこが分かれば情報の良し悪しを見分けることができます。
この記事では、ナッシュ均衡を構成するインディファレントの「厳密な法則」について基本的なところを概説します。これらの法則はGTOだけでなく、エクスプロイトを含む全てのポーカー戦略に当てはまります。
EV重視の法則
一部のレンジの価値を高めるためにEVを犠牲にするハンドは存在しません。正しい戦略は、すべての場面ですべてのハンドで最もEVの高いアクションを取ります。
よく考えてみればわかります。意図的に負けるようなアクションを取るのはどうしてでしょうか?なぜ常に最善の手を打たないのでしょうか?残りのレンジの期待値を上げるためにEVがマイナスであるアクションを取るべきではありません。コールして負けるハンドなら、わざわざコールして損をする理由はありません。
EV重視の法則は次に紹介する「インディファレントの法則」につながります。
インディファレントの法則
混合戦略で取るアクションのEVは同じになります。例えば、コールとフォールドが混ざったハンドの場合、コールのEVは必ず0になります。ナッツを持っている際にコールとレイズの混合戦略をとる場合、早くバリューを取るためにレイズするのと、コールして惑わすのは常に同じ価値ということです。つまり、同じEVを持つアクションを持つハンドは、インディファレントでないといけません。コールが$3、レイズが$3の価値を持つ場合、コールとレイズのどちらかを選択することになります。EVの低いアクションを選ぶ理由はありません。もしコールするほうがフォールドするよりも価値があるのなら、絶対フォールドしてはいけません。
例を見てみましょう。 KQsでUTGオープン、BTN 3ベットでUTGまでフォールドで回ったとします。
表示は「Strategy+EV」にしています。KQsが4ベットした場合とコールした場合のEVが0.31bbであることがわかります。KQsは混合戦略をとっており、この2つのアクションはインディファレントになります。
私たちはよくインディファレントなアクションに遭遇します。A5s(EV0)はフォールドとコールと4ベット、QQ(EV42.7)はオールインと4ベットとコール、88 (EV 0)はフォールドとコールでインディファレントとなっています。純粋戦略をとっているハンドはほとんどありません。このように戦略を混ぜることで、あらゆるエクスプロイト戦略に対してエクスプロイトされない状態を保つことができます。
この法則は、どんな戦略にも当てはまります。GTO戦略やエクスプロイト戦略、その中間のような戦略、全てに当てはまります。相手のリークのある戦略をエクスプロイトしようと思った場合、いくつかのハンドはインディファレントな戦略をとることになります。エクスプロイト要素の強いシミュレーションでは、リークのある戦略に対してインディファレントになる状況が少なくなるため、純粋戦略が多くなる傾向がありますが、インディファレントはGTOが基準ではなく、相手の戦略が基準になります。
ソルバーがEVの低いアクションを薦めることもありますが。これはノイズが原因です。精度を上げて解析をすれば、そのノイズはいずれなくなります。完璧な均衡では、意図的にEVの低いアクションを選択することはありません。ソルバーのノイズについてはこちらの記事で詳しく説明しています。
インディファレントの法則は次の「固定戦略の法則」につながります。
固定戦略の法則
相手が固定戦略をとる場合には、インディファレントなアクションの頻度を変えても問題ありません。相手が戦略を変えてこなければ、混合戦略のミスはエクスプロイトされることはありません。
混合戦略のミスや固定戦略とはどういう意味ですか?
- 混合戦略のミスとはインディファレントなアクションの頻度のミスのことです。
- GTOのように相手によって戦略を変えない戦略のことを固定戦略と呼びます。
後のストリートでレンジが変わったら、EVも変わってきませんか?
期待値はゼロサムゲームを前提に算出されます。一方のプレイヤーが得をするためには、もう一方のプレイヤーが損をしなければなりません。EVが同じアクションで、その頻度を間違えたとしても、相手が戦略を変えなければ損をすることはありません。なお、EVは後のストリートも考慮しています。
例外はEVがゼロサムゲームが前提ではない場合です。レーキはEVに影響するので、混合戦略のミスがあると両方のプレイヤーのレーキの総額が変わってきます。
EVが同じ2つのインディファレントなアクション間でハンドを動かしただけと考えてみるとわかりやすいかもしれません。相手が戦略を変えないかぎりエクスプロイトされることはありません。
例えば、KKが特定のスポットで30%の頻度でコールし、70%の頻度でレイズするのが正しいなら、それをコール50%、レイズ50%にしてしまうと混合戦略のミスになります。しかし、「インディファレントの法則」で説明したように、どちらのアクションをとってもEVは同じです。従って、相手が戦略を変えないのであれば、コールとレイズをどのように混ぜても利益は変わりません。しかし、だからといって何でも良いわけではありません。この戦略にはリークがあります。相手が適切にアジャストすれば、混合戦略のミスはエクスプロイトされます。
KQsでUTGオープン、BTN 3ベットでUTGまでフォールドで回った先ほどの例をもう一度見てみましょう。
フォールドする頻度の高いハンドをすべてフォールドしたとしましょう。EVは変わるでしょうか?
もちろん変わりません。0EVのハンドでフォールドするラインを採用したにすぎません。しかし、BTNが3ベットを広げるとエクスプロイトされてしまいます。この場合は実際にはフォールドしなければEVがプラスのハンドを降りていることになり、損をしています。繰り返しますが、BTNが混合戦略のミスをエクスプロイトできるのは、戦略を変えた時だけです。
この概念を理解するには「最も良いアクションは相手の戦略を基準に決まる」という前提を理解する必要があります。レンジにおいてインディファレントになっている部分は、相手がどのようにプレイするかによって決まります。
もし自分のインディファレントなアクションの割合を変えたいのであれば、相手の戦略を変えないといけません。詳しくはこちらの記事をご覧ください。GTOは固定戦略です。固定戦略は混合戦略のミスに対しては得をしませんが、「純粋戦略のミス」に対しては利益を得ることができます。固定戦略に対して損をする行動はすべて「純粋戦略のミス」です。GTOは「どんなミス」に対しても利益的だと誤解されがちですが、GTOは純粋戦略にミスがある場合に対してのみ利益的になるので、これは正しい理解ではありません。ただ、レベルの高いプロですら、純粋戦略のミスは多々あるほどポーカーは難しいゲームなので、それほど細かく気にする必要はないでしょう。詳しくはこちらの動画をご覧ください。
FAQ
以下によくある質問を記載しました。ここではGTOに関する基本的なトピックを網羅しています。どんな質問でもDiscordに気軽に連絡してください。
メタゲーム的な戦略とはどういうものですか?
相手のミスを誘発させるために、EVがマイナスなプレイをしていると相手に認識させることは可能です。例えば、ルースなイメージを作るためにEVがマイナスなブラフをすることは、将来的に相手のミスが起こるのであれば有効かもしれません。しかし、GTOではそういった将来のミスがないため、このような理論は成り立ちません。さらに、EVがマイナスの「ミス」が長期的には最もEVの高い動きであるならば、それは実際にはミスではなく、正しいエクスプロイト戦略であり、EVがプラスなアクションであるという解釈もできます。時間軸を伸ばすことで、こういったメタゲームのパラドックスは解消されます。
GTOがEVマイナスなプレイをすることはありますか?
あります。ただし、対戦相手がミスをしている場合に限ります。例えば、相手の3ベットがAAしかないとしても、KKを4ベットオールインすることをGTOは推奨するかもしれません。これは明らかに悪いプレイです。ただ、相手は他のプレミアムハンドをレイズしないことで、バリューをそれ以上に失っています。ゲームツリーの一部分でGTOに対して利益を得ることは誰でもできますが、他の部分で結局損をしてしまいます。
相手がAAしかレイズしないことが確定しているなら、戦略を変えてエクスプロイトするべきです。しかし、仮に戦略を変えなかったとしても、相手はKKやQQなどでバリューを失うミスをしています。
GTOに勝つことはできますか?
できません。ナッシュ均衡の定義は、どのプレイヤーも戦略を変えてもEVを増やすことのできない状態のことを指します。一部のラインのEVを犠牲にして、特定のラインのEVを増やすことはできますが、GTOに勝つことは定義上不可能です。
ただし、例外としてGTOはマルチウェイにおいてはエクスプロイトされない戦略を構築することはできません。
ソルバーがEVマイナスなアクションを取る時があるのはなぜですか?どうして最もEVの高いアクションを取らないのでしょうか?
これはソルバーノイズが原因です。ソルバーは完璧な精度で解析している訳ではなく、ソリューションには一定のノイズが入ります。ソルバーノイズについてはこちらの記事で詳しく解説してあります。
ソルバーがEVマイナスなアクションを取る時があるのはなぜですか?どうして最もEVの高いアクションを取らないのでしょうか?
混合戦略のミスとは、正しくない頻度でインディファレントなアクションを混ぜてしまうことを指します。例えば、KKが30%の頻度でコールし、70%レイズするのが正しい場合に、50%/50%の頻度をとってしまうと、これは混合戦略のミスとなります。レンジ全体よりも、特定のコンボに対して使われます。
純粋戦略のミスとは相手が固定戦略の場合にも負けるミスを指します。
混合戦略のミスは相手がそのミスに対して戦略を変えてエクスプロイトしようとしてきた場合のみ問題になります。
固定戦略とはなんですか?
固定戦略は相手によって戦略を変えることをしません。同じ局面であれば常に同じようにプレイします。GTOがその代表例です。反対に動的戦略とは相手に合わせて変化する戦略のことを指します。詳しくはこちらをご覧ください。
混合戦略のミスがエクスプロイトされない相手に対しては、レンジチェックやレンジベットを全ての局面で使っても良いですか?
混合戦略のミスはエクスプロイトすることが可能ですが、その際相手はGTO戦略以外のものを使う必要があります。そのアジャストは意図的な場合もありますが、相手の自然なプレイスタイルである場合もあります。混合戦略のミスを放置して単純化しすぎないように気をつけましょう。
例えば、リバーで全てのインディファレントなブラフキャッチャーをコールに回してしまうと、バリューヘビーな戦略をとっているプレイヤーに簡単にエクスプロイトされてしまいます。フロップのチェックレイズに対して、本来は混合戦略なのに、フォールドしすぎればブラフの多い相手にはエクスプロイトされてしまいます。
詳しくはこちらの動画をご覧ください。
GTOは混合戦略のミスをエクスプロイトできないのに、なぜ強いと言われているのですか?
GTOは相手が純粋戦略のミスをした時、全ての局面で利益を得ることができます。純粋戦略のミスは固定戦略に対して負けます。純粋戦略のミスとは相手の戦略に対して、確実にEVがマイナスなアクションのことを指します。