GTO Wizardは人工知能と従来の解法を組み合わせることで、これまでにない高品質のGTOソリューションを驚異的な速さで提供しています。何時間もかかっていた計算が、ブラウザから数秒でできるようになっています。
これを聞いて「このソリューションの精度はどの程度なのだろうか?」と疑問に思う方は多くいるかと思います。この記事では、従来のソルバーと比較して、どれくらいの精度で解かれているのか紹介していきます。
概要
GTO Wizardは、高品質のGTO戦略を提供するよう努めています。そのためソリューションの精度と解法について透明性を保っています。ほとんどのGTO Wizardソリューションの精度は、ポットの0.1%から0.3%で解かれています。
ポストフロップの精度はナッシュディスタンスで測定されます。ナッシュディスタンスとはソリューションのエクスプロイトの可能性を表し、現在のソリューションの潜在的なEVの最大損失をBBで割った値で測定されます。ナッシュディスタンスは低い方が優れています。例えば、5bbのポットで0.3%の損失は、そのソリューションが最大で0.015bb/ハンド、つまり約1.5bb/100、エクスプロイトされる可能性があることを意味します。
- すでに解かれているソリューションである、GeneralソリューションやSimpleソリューションなどは、標準的なCFRソルバーを使用して計算されています。それらのソリューションは、少なくとも0.3%ポットの精度で解かれています。しかし、3BPや4BPのようなSPRの低いスポットでは、より高い精度(0.1%pot)で解かれることがよくあります。
- カスタムソリューションは、入力された値に従ってその場で解かれます。これらはGTO Wizardが買収したRuse AIによって開発された最先端技術を用いて解かれています。ナッシュディスタンスは、ノードロックしたフロップ戦略によって測定されます。
- GTO Wizardのすべてのリバーでのスポットは、従来のCFRソルバーを使用して、0.1%のナッシュディスタンスに収まるようリアルタイムで再度計算されています。
GTO Wizard AIソリューション
GTO Wizard AIソリューションは、入力された値に従ってその場で計算されています。従来の解き方と予測ニューラルネットワークを組み合わせた最先端の技術を用いて、どんなスポットでも数秒以内に解くことができます!しかし、AIが生成するソリューションの精度はどの程度なのでしょうか。
GTO Wizard AIとPioSolver、Slumbotを比較すると、驚くべき結果が得られました。
Slumbotとの比較
Slumbotは、近似ナッシュ均衡戦略をプレイするオープンソースのポーカーボットです。事前に計算されたソリューションに従ってプレイし、相手のアクションとベットサイズを、抽象化されたベットサイズに置き換えます。Slumbotは、直近のAnnual Computer Poker Competition (ACPC)で優勝しており、GTO Wizard AIの強敵です。
GTO Wizard AIはSlumbotとのヘッズアップで15万ハンドプレイして、19.4bb/100のウィンレートを出して勝利しました。この勝負では、各プレイヤーに与えられた時間はわずか7秒で、他のどのソフトウェアよりもはるかに進んだ技術を持っています。
続きは「ポーカーポットのトップを倒す」をご覧ください。
PioSolverとの比較
最も重要なのは、PioSolverに対してどの程度のパフォーマンスを発揮するかということです。
速さと正確さ
PioSolverのような従来のCFRソルバーでは、スポットを素早く解くことはできません。高精度で解くためには、優れたハードウェアと多大な時間を必要とします。下記の図は、GTO WizardとPioSolverの速度と精度を比較したものです。
- PioSolver – 0.23%の精度で解くのに4862秒(1時間21分)必要とする。ハードウェア:16コア@5GHz、128GB RAM。
- GTO Wizard – 0.22%の精度で解くのに6秒かかる。ハードウェア:2コア、8GBのRAM。
エクスプロイトされる可能性
PioSolverとGTO Wizard AIのカスタムソリューションを比較するために900種類のフロップを計算しました。
GTO Wizard AIのソリューションがどの程度正確であるかを知るため、フロップの戦略をPioSolverでノードロックし、EVの損失を測定しました。その結果、GTO Wizardのカスタムソリューションは、PioSolverが導き出した最善のエクスプロイト戦略に対して、平均してポットの0.21%を失うだけでした。ほとんどのソリューションは0.15%から0.30%の精度で解かれていました。
以下の図では、GTO Wizard AIが異なる精度レベル(横→)を達成する頻度(縦↑)を示しています。
測定方法
Here’s how we measured the accuracy of our custom solutions:
- PioSolverで様々なフォーマットとプリフロップのアクションで、900種類のポストフロップスポットを解き、GTO Wizard AIで同じスポットを解いた時と比較する。
- GTO Wizardの全フロップ戦略の片方のプレイヤーの戦略をPioSolverでノードロックノードロック
ソルバー内のあるノードにおいて、あるプレイヤーの戦略を固定すること。通常、エクスプロイト的な調整を計算するために行われる。 し、現在の戦略に対するEVの損失を測定する(損失 vs 固定GTO)。 - そして、ノードロックした状態で再度解き直し、PioSolverがGTO Wizard AIの固定フロップ戦略を最大限にエクスプロイト最大限にエクスプロイト (MES)
相手のミスに漬け込み、バリューを完璧に最大化する戦略。
できるようにし、EV損失(損失 vs 最大のエクスプロイト戦略別名ナッシュ距離)を測定する。
なぜフロップだけをノードロックしたのか?なぜターンとリバーもノードロックしないのか?その理由は、AIソルバーが後ストリートでの戦略を実際に計算せず、ニューラルネットとルックアヘッド関数を使って、後のストリートのEVを予測していているからです。フロップを解いた後、ノードロックをするターン戦略はありません(それはまったく新しい解き方になります)。GTO Wizardで解かれているリバーの戦略は、従来のCFR(PioSolverのような)を使用しています。
GTO Wizardは、GTO学習ツールの市場において、これまでにない速さと精度を皆さんに提供できるよう努めています。ご質問がある方は、discordチャンネルでお気軽にご連絡ください!
GTO Wizard AIの詳細については、以下の記事をご覧ください。