「Libratus」の最新バージョンが、中国の投資家らのチームを破った。カーネギーメロン大学が開発した最新版のポーカー・プログラムは「Lengpudashi」と呼ばれる。

AIの名前は「冷酷なポーカーの達人」

ベンチャーキャピタリストで、ポーカーの世界的トーナメント「ワールドシリーズオブポーカー」(WSOP)のベテランでもあるアラン・ドゥは、冷酷無比な敵を相手にした知恵比べの5日目を迎え、負けがかさみつつあった。
ドゥの敵は、文字どおり人間ではなかった。そもそも、それが「Lengpudashi」と対戦することになった理由だ。
Lengpudashiは、2017年1月に世界屈指のプロのポーカープレイヤー4人を破るという偉業を達成した人工知能プログラム「Libratus」のアップデートバージョンだ。
Lengpudashiは、ペンシルベニア州ピッツバーグにあるカーネギーメロン大学スーパーコンピューティングセンター内に存在する。Lengpudashiは「冷扑大師(冷酷なポーカーの達人)」という中国語名を、Libratusという英語名に似せて英語表記にしたものだ。
ドゥら5人のチームメンバーは5日間にわたり、Lengpudashiを相手に3万6000番勝負をおこなった。4月10日、中国の海南島にあるリゾートカンファレンスセンターでポイントをまとめた最終スコアが発表された。
結果は、AIの圧勝だった。

エンジニア、コンピューター科学者、投資家で構成

ポーカーは、ベンチャーキャピタリストのあいだで人気のゲームだ。というのも「プレイするすべての勝負が、ひとつのベンチャーのようなものだ。リスクと投資利益率(ROI)を評価しようとするわけだから」とドゥは言う。
ドゥ本人も、立ち上げ前や直後の企業に出資するシード投資家だ。2016年には、中国本土に住む中国人として初めて、ラスベガスでWSOPのゴールドブレスレットを獲得した。「今回のワールドクラスの対戦相手との勝負でも、我々は自分をしっかり保っていた」
ポーカーの複雑なベット戦略とブラフ(自分の手札が強いと相手に信じ込ませること)の要素は、AI研究者にとっておおいに興味をそそるものだ。
しかも、プレイヤーは対戦相手の手の内を見ずに、ベットやブラフ、フォールドなどのアクションを決めなければならない。チェスや囲碁などの盤上ですべての駒が見えているゲームとはまったく異なる難題だ。
ドゥは勝負にあたり、プロプレイヤーに足りない点を補強し、勝利を手に入れようとした。AIに関する知識を採り入れたのだ。
長年にわたるプロの経験に頼った1月の対戦者たちとは異なり、ドゥ率いる中国チームはエンジニア、コンピューター科学者、投資家で構成されていた。チームのメンバーは人工知能とゲーム理論の知識を応用し、AIの動きに対抗しようと試みた。
だが、それだけでは足りなかった。

AIをゲームで鍛える目的は推論スキル

AIの能力を示す最新事例となった今回の対戦は、中国のベンチャーキャピタル、シノベーション・ベンチャーズ(Sinovation Ventures)と海南省行政機関が企画したものだ。しかし、2016年にソウルでおこなわれたグーグル傘下のディープマインドが開発した「アルファ碁」と韓国のイ・セドル九段との対戦ほどは話題にならなかった。
おそらく、それほど関心を持たない野次馬でさえ、AIソフトウェアが人間を出し抜くのを見るのにすでに慣れてきているせいだろう。
グーグルは4月10日、5月下旬に人間とマシンとのリターンマッチを実施し、ディープマインドのAIソフトウェアが中国のトップ棋士、柯潔(カ・ケツ)九段に挑むと発表した。
カーネギーメロン大学でコンピューター科学を研究するトマス・サンドホルム教授は2004年以降、Libratusを基礎とする研究を進め、不完全な情報をもとに状況を判断する能力に磨きをかけてきた。
チェスや囲碁、ポーカーなどのゲームで勝てるようにAIを鍛えるのは、ゲームそのものが目的ではない。ポイントは、ゲームの管理された環境がコンピューターの戦略的な判断能力を向上させるのに役立つことにある。
そうした推論スキルは、ビジネスや金融、サイバーセキュリティといった現実世界の問題に応用できると、サンドホルム教授は説明する。

5年以内にスマホで稼働できる可能性

サンドホルム教授が指導する大学院生で、Libratusの共同開発者でもあるノーム・ブラウンは「コンピューターと人間がそれぞれ何を得意とするのかについては誤解がある。ブラフはきわめて人間的なものと考えられているが、そうではないことが明らかになっている」と語る。
「手札が弱いときにブラフを仕掛ければ稼げる可能性があることを、コンピューターは経験から学習できる」
Libratusは、人間のポーカープレイヤーの成功例を模倣するのではなく、ゲーム理論からブラフの技を学習した。こうしたAIの戦略は「ゲームのルールのみから計算したもの」であり、過去のデータを解析したものではないと、サンドホルム教授は説明する。
シノベーションの創設者で、ベンチャーキャピタリストやイベント企画者として活動するリー・カイフー(李開復)によれば、ここ5年のAI技術の急激な加速はビッグデータ解析が出現しなければ不可能だったという。
リー率いるベンチャーファンドは、顔認識や融資申請技術を手がけるスタートアップなど中国のAI関連企業に1億2000万ドルを投資している。また、別のAIベンチャーにも現在調達中の資金のかなりの部分を投じる計画だ。
海南島での対戦でもうひとつ明らかになったのは、AIが次第に低価格なものになっている可能性だ。ブラウンによれば、今回の対戦で示された演算力は2万ドル未満で手に入るという。
「驚くほど安価だ」とブラウンは言う。「5年以内にスマートフォン上で稼働するようになる可能性がある」
(協力)Christina Larson
原文はこちら(英語)。
(執筆:Bloomberg News、翻訳:梅田智世/ガリレオ、写真:alexandradabija/iStock)
©2017 Bloomberg News
This article was produced in conjuction with IBM.