ソルバーで勉強する際によくある質問の1つは、「あるアクションの方がEVが高いのに、なぜソルバーはこのアクションを取るのか」というものです。例えば、以下のシナリオでは、チェックの方がベットよりもEVが高いことがわかります。
なぜこのようなことが起こるのかを理解するには、まずゲーム理論の基本原理を理解する必要があります。
混合戦略の法則
完全に均衡した状態では、混合戦略のアクションは常に同じEVを持つはずです。つまり、ハンドが2つ以上のアクションを混ぜる場合、それらのアクションは同じEVになるはずです。なぜ意図的に悪い戦略を選ぶのか考えてみましょう。本当の意味で完璧な戦略は、「バランスのためにEVを犠牲にする」ようなことはしません。これはナッシュ均衡の決まりです。
上の例では、ソルバーがチェックと27%、73%、127%のベットの混合戦略をとっています。しかし、これらのアクションは同じEVではありません。では、なぜこのようなことが起こるのでしょうか?A7oでのチェックは最もEVの高いアクションなのに、なぜ「inaccuracy(不正確)」とみなされるのでしょうか?
ソルバーのノイズ
GTOソリューションは完璧ではありません。実際には、GTOソリューションは完璧に計算されるわけではなく、一定のエクスプロイト可能なしきい値まで解かれます。
ソリューション全体のエクスプロイトが少ないほど、その精度は高くなります。私たちは、ソリューションの精度を「Nash Distance」またはdEVと呼ばれる指標で定義します。例えば、GTO Wizardは通常ポットの約0.2%〜0.3%まで解析します。この差に対してあなたはエクスプロイトすることはできるでしょうか?
BTN対BBのシナリオで、ポットが5.5BBだとします。つまり、このソリューションをエクスプロイトするには、最大でも5.5BBの0.3%、つまり1ハンドあたり0.017BBということになります。これは人間のプレイのレベルをはるかに超えています。
これは私たちが「ソルバーノイズ」と呼んでいるものです。ハンドは常に最も高いEVのアクションを取るとは限りません。完璧な精度で解析すれば、このノイズはなくなり、混合されたアクションはすべて同じEVになります。
一度もプレイしたことのないようなラインを取るような状況では、EVが大きく異なることに気づくかもしれません。これは、ソルバーが効率を上げるために、大きく偏る(0%の)ラインの計算を解析の早い段階で止めてしまうためです。これは正常なことですが、そのようなラインの戦略とEVは正確ではありません。
エクスプロイトされる可能性について
それでは、EVが最も高いアクションが常に最善手ということでしょうか。
必ずしもそうとは限りません。これを精密に解析すれば、チェックが正しいアクションになる可能性もあります。しかし、もしあなたが常にA7oをチェックするのであれば、理論的にはBBはA7oのチェックのEVが低くなるように戦略を変えることができるかもしれません。覚えておいてほしいのは、ソルバーはエクスプロイトがされない状態を保ったままアクションを混ぜるということです。
上の例を完璧な精度で解いたらどうなるでしょうか?それでもチェックが最もEVの高い手になるでしょうか?
A7には以下の二つのうちどちらかが起こります:
- チェックはより低いEVに収束し、決して使われなくなる。
- チェックは他のベットサイズと同じEVに収束し、ある程度の頻度で使われ続ける。
完璧な精度で解かなければ、正確に知る方法はありません。多くの場合、低頻度のアクションは消えてEVが低くなりますが、一定の頻度で行われるアクションは戦略の一部として残ります。そのため、3.5%未満の頻度のアクションは「不正解」と表示されます。
別の例を見てみましょう:
例
例2: コールの方がEVが高いにもかかわらず、A7oはフォールドを混ぜている
ここではA7oがコールとフォールドを混ぜていますが、コールの方がフォールドよりもEVがかなり高いようです。コールの方がフォールドよりもEVが約1.7BB高いのです。ではなぜフォールドがあるのでしょうか?
ここでは、この状況を俯瞰的に見る必要があります。コール後のポットは200.05BB。つまり、1.8BBの誤差はポットの約0.9%に過ぎません。実際には、これは画面上の数値よりもずっと小さいものです。ポットが大きくなれば、1%の誤差は数値上はもっと大きく見えます。
全てをコールする問題点は、エクスプロイトが可能になるためです。ブラフキャッチャーのギリギリのラインをすべてコールしたらどうなるでしょうか。すぐにコールしすぎになり、バリューの比率が高い相手にエクスプロイトされる可能性があります。
なぜ完璧に正確に解析しないのか
完璧なソリューションを作成することと多くのソリューションを作ることは両立しません。原因は、ソルバーが均衡に近づくにつれて収束が遅くなるためです。完全に未解析の状態から0.5%のdEVになるまでには、0.5%のdEVから0.25%のdEVになるまでと同じくらいの時間がかかります。
精度を2倍にすると、解析にかかる時間も2倍になります。そして、得られるものは少なくなります。0.3%dEVの精度のソリューションは、0.15%dEVのソリューションとほとんど同じで、どちらもソルバーノイズがあります。
代わりに解析しやすい非常に単純なツリーを作成する方法もありますが、ツリーを単純化しすぎると、ソルバーがそのツリーの制約をエクスプロイトすることによって意図していない差が生じ、独自の問題を引き起こします。
結局のところ、極端に高い精度と微細なEVにこだわることは、あまり意味がないということです。いずれにせよ、そのソリューションは人間のレベルをはるかに超えています。
これが私たちの行う解析の一例です。見ての通り、最初は速く進み、均衡に近づくにつれてどんどん遅くなっています。ここではポットの0.3%まで解析してあります。
注意点
ソルバーが混合戦略を取る場合、EVの高いアクションではなく、頻度の高いアクションを探すようにしましょう。なぜなら、EVの差はソリューションのノイズによるものだからです。
混合戦略内のアクションは同じEVであるかのように扱いましょう。どんなEVのズレも誤差の範囲であると考えて問題ないです。(すべてのハンドはほとんどそのEV近辺です)。
GTOの本質は、エクスプロイトされない最も高いEVの戦略を見つけることです。このような細かい誤差は、すべてのソルバーのソリューションに見られます。あなたがするべきことはより高いレベルの戦略を抽象化し、GTOへの理解を深めることであり、頻度の暗記ではありません。