'アルファ碁'(AlphaGo)とイ・セドル9段の対決について
 
160128-NS-01

1996年、私は物理学を専攻で選択した。 ニュートン力学はラプラスが“宇宙のすべての粒子の位置と速度が分かるならば宇宙の未来を予測することができる”と話したように万物の道理を決定的に説明できるようだった。ハミルトン力学は末梢的な(外部で力が加えられればすぐに加速度で反応するので)ニュートン力学に比べてさらに万物が哲学的に動くような印象を与える事に魅了された。

しかし翌年3学年になって量子力学を習って、現象を正確に把握すれば未来を予測することができるという決定論に懐疑を持って、‘宇宙のすべての粒子’はおろか粒子数が三、四個だけでもこれらの相互作用をすっきりした数式で解きほぐすことができないということに大きく失望してさまよった。

そうしている間に偶然TVでIBMのチェス コンピュータ‘Deep Blue’が世界チャンピオン ガルリ・カスパロフ(Garry Kasparov)を歴史上初めて勝つ事を見た。 私もいつかはBig Blue (IBMのニックネーム)でスーパーコンピュータを作る事に参加したいという漠然とした夢を持って電子工学に専攻を変えた。 そしてそれから10年後である2007年にニューヨークのIBM研究所に入社することになる。

当時IBMはチェスの次にクイズを解くスーパーコンピュータ‘Watson’を開発していたし私もこのプロジェクトに間接的に参加した。 チェスは場合の数は多いが、規則と目標自体は単純なゲームだ。 コンピュータの長所、すなわち最大化された演算能力が光を放つ事にぴったりな分野だ。

しかし人間が使う自然語(natural language)は規則が単純でなくて、同じ表現でも全体脈絡により意味が変わって、あらゆる比喩と逆説的な表現でぎっしり埋まってコンピュータにとってははるかに難しい分野として見なされる。

だが2011年というクイズショーでWatsonは歴代最高の出演者二人を圧倒的な差ではね除ける。 クイズショー当時Watsonはインターネットに連結されていなかったけれど、出場前に百科事典数セットとウィキペディアのすべてのページを学習した結果を膨大なメモリーに含んでいた。 

Watsonは66問を正解して9問を間違えた。 正解した問題中には比較的単純な事実を尋ねる問題もあったが、容易ではない推論や連想を要求する問題もあった。

例えば、‘Also on your computer keys(コンピュータ キーボードの上にも)’という語を与えて、“Proverbially、it’s where the heart is(心が留まる所-筆者意訳)”という質問に“Home。”と答えたことのようにだ(キーボードに‘Home’キーがあり、“Home is where the heart is”という構文がある)。

しかし人間出演者が簡単に正解した事をWatsonは間違うこともあった。 ‘U.S.cities’という提示語の“Its largest airport is named for a World War II Hero;its second largest、for a World War II Battle。”という質問にTorontoだと答えたがこれはカナダの都市だ。 正解は戦争英雄O’HareとMidway海戦の名前を取った空港を持っているシカゴだ。

後ほどWatsonの開発責任者Dave Ferruciはアメリカにもトロントという名前の都市があり、カナダ、トロントが米プロ野球アメリカンリーグに属したチームを保有している点などがWatsonがトロントを取り除くことが出来なかった理由に上げて、また他の開発者Chris WeltyはWatsonが“its second largest、for a World War II Battle”をまともに解釈できなくて‘it’s (the) second largest’で誤解したようだと説明したことがある(トロントはニューヨークに続き北米で二番目に大きい空港を持っている)。

2011年秋IBMを退社して帰国して亜洲(アジュ)大で教鞭を取ってコンピュータのハードウェア分野を研究するが、直接的なスーパーコンピュータ開発や人工知能分野とは一歩離れて過ごした。 本業の他に私が最も関心がある分野がまさに囲碁である。

私は韓国棋院公認アマ5段で2面打ちか、3面打ちで打つプロ師範との指導対局で4子では負けない自信がある。 4子で四、五対局連勝をおさめた後で最近では三子で打つが、もしイ・セドル9段と100万ドルがかかった囲碁を一対一で打つならば六子でも大変なようだ。

ところがこの前AlphaGoのニュースを聞いてとても驚いた。 今まで最高の囲碁コンピュータはせいぜい出てきても似たような水準であったのだが、AlphaGoは(最高級とは実力差が大きく出るにしてもとにかく)プロに互先で勝ってイ・セドル9段に挑戦するとは!

まずAlphaGoと対局した樊麾の棋譜を見つけてみた。 白黒どちら側が人でコンピュータなのか私は区分しにくかった。 二人とも私より棋力が強いということは感じることができた。 この二人を区分することができるかどうかは人工知能で非常に意味深長な問題だ。

“コンピュータが考えることができるか?”ないしは“コンピュータが知能を備えたのか?”という質問は曖昧だ。 ‘知能’が何か明確に定義するのが難しいためだ。 それで人工知能の父として選ばれるアラン・チューリング(Alan Turing、映画 <イミテーションゲーム>のモデル)は‘チューリング テスト’というのを提案した。

人の対話をまねることができる自然語処理コンピュータがあるとする。 このコンピュータが人Aと対話した文を、評価者である別の人Bが読んでどちら側が人でどちら側がコンピュータなのか区別できるかを問い詰めることがチューリング テストである。 

カカオトークが出てくる前MSNメッセンジャーが大きく流行した時、‘シムシム’というチャットロボットがあったことを記憶するだろう。 シムシムが人とチャットした記録をIDを分けて見てもたちまちどちら側がチャットロボットなのか難なく区別することができた。

すなわち、チューリング テストによればシムシムは対話する知能をまだそろえられないのだ。 チューリング テストを囲碁に適用すれば、AlphaGoが碁を打つ知能を備えたかという問題は私たちが棋譜を見てAlphaGoがどちら側なのかを判別することができるかどうかで帰結される。

今ようやく話せるようになって読み始めた幼い子供が対話文を見てどちら側がシムシムなのか見つけにくいように、棋力が弱い私としてはAlphaGoと対局した樊麾を区別することは当然難しいだろう。

だが、最近世界第一人者として認定されるコ・ジェ9段がインタビューで明らかにしたように超一流棋士も棋譜でAlphaGoを区別しにくいならば、棋力と関係なくAlphaGoは“碁を打つ知能を備えた”と話すことができることだ。


 

AlphaGoの開発チームがNatureに発表した論文にはAlphaGoと対局した樊麾の対決に関してもう少し詳しい内容がのせられている。 まず、AlphaGoは対局した樊麾と公式対局五局の他にも非公式対局五局をさらに競った。

全て中国ルール(コミ7目半)を適用するものの、公式対局は考慮時間各自一時間に30秒秒読み3回で、非公式対局は考慮時間なしで30秒秒読み3回だけで打った。 一見早碁対局であるほどコンピュータが有利そうだがAlphaGoは公式対局五局を全て勝利した反面、非公式対局五局中二局を負けた。 

この点でAlphaGoが布石段階以後に着手を決める時、読みに過度に依存すると見られる。

AlphaGoの読みはまだ完ぺきなはずがない。 チェスでコンピュータが人に勝ったのが20年前でコンピュータの演算能力はその後にも今まで毎2年ごとに二倍ずつ発展してきたがコンピュータがまだチェスを‘完全に解く’まではできなかった。

完全に解くということは、終局まですべての場合の数を問い詰めて各場面での最善の手を特定できるということだ。 すなわち、“白黒の両方が最善で打つと、何手目に至ってどちら側が勝つ(または引きわけ)”と話せるということだ。

例えば、15路盤で打つ時は(3-3、4-4制限ない)五目並べではすでに1993年に白がどのように応酬しても先着する黒が無条件で勝つことができる手順を捜し出した。

チェスは五目並べより場合の数がはるかに多くて、いまやっとコマが白黒合わせて6個残っている時、配置に関係なく皆解かれて、7個残った場合が一部解けた程度だ。

チェスも32個のコマで最初に始める時から解決するにはまだ遥かな時間が必要で、ましてチェスより場合の数がはるかに多くの囲碁では本当に遥か彼方のことだ。

もちろんAlphaGoの計算(読み)速度は人(一流プロといっても)を圧倒するが、プロは着手を決める時読みにだけ全面的に依存しはしない。 すなわち、プロは囲碁理論、形態にともなう急所または、よく‘感覚’と呼ぶ直観を通じて、良くなさそうな手は早目に枝刈りとなり、そうでない場合は集中的に確かめてみる。

AlphaGoはまだこのような面でしばらく落ちると考えられる。 AlphaGoのプログラマーが粗末な囲碁実力を持ったことは別に置いても、抽象的な囲碁理論、例えば‘入界宜緩’のようなものをどのようにコンピュータが理解できるように記号化(数値化)するだろうか?

また、人は囲碁本で勉強した脈は、実戦で‘似た形態’が出てくればしばしば適用することができる。 本に出てきた例題とは若干違うが同じ脈絡というものを認知することだ。 

このような認知分野は計算分野とは違ってコンピュータが非常に脆弱な分野だ。 写真を見て犬と猫を区別するのは五才になった幼い子供にとても容易なことだ。 ところが犬と猫を区分する基準をコンピュータが理解できるように一度作ってみなさい。

1)猫が犬より尻尾が長い方だ! ->ところがコンピュータは尻尾を探せない。

2)胴で幅が突然狭くなる部分を! ->それでは胴は?

……どうしてどうしてやっとコンピュータが尻尾を探せるようにするといっても、このような規則では不幸な事故で尻尾が切られた猫は絶対区分することができない。

しかし私達の子供たちにはこのような形で教えない。 道を通り過ぎて見え次第これは猫、あれは犬という式で何度か模範を見せれば子供たちは一目で(直観)犬と猫を区分するのはもちろん、猫が犬より尻尾が長い方という特徴も把握する(洞察)。

人のこのような学習方式をマシン ラーニング技法がまねようとするが、最新技法を適用してもまだコンピュータの正解率はたくさん落ちる。 本論に戻れば、AlphaGoは囲碁理論や形態を理解できない関係で、読む時プロならば初めから考慮することもなかったことを計算するのだが多くの演算能力を浪費するので早碁でかえって弱い姿を見せたこととして考えられる。

AlphaGoは中盤以後の読みに絶対的に依存することとは違って序盤には既存棋譜を統計的に分析した結果を利用すると見られる。

韓国にオロ、タイジェムのような対局サイトがあるように主に外国人が利用するKGSというサイトがあって、AlphaGoはKGSで行われた6-9段ユーザーの棋譜16万件に現れた約3千万の着手を学習したと論文で明らかにした。

明らかにしてはいないが論文の図5を見れば、AlphaGoは序盤布石段階で各着手位置別で16万局のデータベースを基に勝率期待値を計算してそのうちの最も高いところを選択すると見られる。 その上に中盤には相手が着手した地点の周囲で読みをする所がある程度限定されるが、序盤には範囲がとても広いので仕方ない選択と考えられる。

イ・セドル9段が初手を隅よりは辺や中央に着手したりして、プロ囲碁で絶対出てこないような布石を持ち出すならばAlphaGoがどのように対応するのかとても気になる。

特に、そのような状況で遠方にシチョウを使うならばAlphaGoが序盤に滅びる可能性もあると考える。 一度も行ってみたことがないところに導いて行くことによってコンピュータを圧倒的な記憶能力から武装解除させる戦略は1997年にすでにカスパロフがDeep Blueと対決した六局シリーズのうち初めの対局で使ったことがある。

チェスの初手には数十種類が可能だが実際にたくさん置かれるのはたいてい4つだというのだが(囲碁で定石、小目、他/高目打つように)カスパロフはこれを抜け出してわずか3手で少なくともプロ レベルでは一度も出てきそうにない布石を作り、結局その対局を簡単に勝った。

また、その対決でDeep Blueは大勢観に脆弱な姿を見せた。 カスパロフがポーン(将棋の歩のように一間だけ動くコマで点数は1点、しかし相手陣営の最後まで進出すればクイーン、ルーク、ビショップ、ナイトなどに成る事ができる)の進出を縛っていたDeep Blueのビショップ(対角線に動くコマで点数は3点)を除去するために自身のルーク(直線に動くコマで点数は5点)をエサに掲げた時Deep Blueはここに置こうとした。

より点数が高いコマといつでも対等交換しろとのチェスの基本理論にしばられてその後に隠された長期的な戦略が読めないのだ。 Deep Blueの陣営が弱くなった合間を利用してカスパロフのポーンが進出して40余手で非常に優勢な局面を作った。

イ・セドル9段が序盤に捨て石作戦を駆使して圧倒的な勢力を積もうとする時、AlphaGoがこれに対応することができるか気になる。

カスパロフが最初の対局を簡単に勝ったのだがなぜ全体シリーズでは敗北したのだろうか? 先立って話した通り最初の対局の40余手でカスパロフが圧倒的に優勢な形勢になったが、44手目Deep Blueがおいた手が問題であった。

後ほど明らかになったことによればそれはDeep Blueプログラムのバグのために出てきたことなのだが形勢に何の助けもならない手であった。 その代わりチェスの上手ならばこの一手というほどの他の有力な手があった。 そしてすぐ次の45手目にDeep Blueが降参を宣言した。 

カスパロフは勝ったがDeep Blueの44手がまったく理解できないことが非常に苦しかった。 それで宿舎に戻って他の一流上手らと共に、Deep Blueが出てくる前まで最高に打ったFritzというチェス コンピュータまで動員して以後進行を分析した。

その結果、44手の代わりに一見有力に見えた手をDeep Blueが置いたとすればそれから20手後にカスパロフが勝つ道があるということを発見した。 Deep Blueの44手は単にバグのために次の着手を探せなくてランダムで置いたことなのだが、これをカスパロフはDeep Blueが20手後まで見通すことができて一見有力に見える手を捻ったものと誤解した。
 
2局ではDeep Blueが白を捉えた。 囲碁では黒が先着するアドバンテージをコミを負担させることによって相殺するが、チェスではコミというようなものがなくて先に打つ白が絶対的に有利だ。

代わりに、白をかわるがわる捉えるために常に交互に置いて点数(勝ち1点、引き分け0.5点、負け0点)で勝負をつける。 すなわち、黒の立場では相手が似た実力ならたいてい不利な形勢にならなければならないが、だとしても引き分けることができる道を探すことが重要だ。

ところが2局でカスパロフは少し不利な形勢になるとすぐに早くあきらめてしまった。 カスパロフでは合計6局中で1局に勝ったしまだ4度の対局が残ったが、20手も見通すことができるコンピュータを相手に無理はしないようにという考えだった。

ところが2局が終わった後に黒が難なく引きわけることができる道があったとのことが明らかになるとすぐにカスパロフはより一層心理的に動揺した。

3~5局を難しく引き分けた後迎えた6局でカスパロフは序盤に簡単な手順を勘違いして一時間もならずに降参し、全体シリーズがDeep Blueの勝利に終わった。 イ・セドル9段が警戒するだけのことはある。

3月の対決を予想してみれば私はイ・セドル9段が特別な作戦なしでただ通常のインターネット碁を打つようにして5対0で勝つと見る。

一つさらに望むならば、3対0でシリーズ勝利を決定した次の残りの二対局程度は、先立って話した通り序盤を完全に新しく作ると同時にシチョウを活用したり、素敵な捨て石作戦を広げたりして最新人工知能アルゴリズムと強力な計算力にだけ依存して囲碁に挑戦することはまだ明らかな限界があることを見せれば良いだろう。

2016.2.2.亜洲(アジュ)大学校電子工学科教授カン・ドングン(kam@ajou.ac.kr)
原文記事:'アルファ碁'(AlphaGo)とイ・セドル9段の対決について

関連記事


nature [Japan] January 28, 2016 Vol. 529 No. 7587 (単号)

ネイチャー・ジャパン 2016-02-05
売り上げランキング : 81608
by ヨメレバ
月刊碁ワールド 2016年 02 月号 [雑誌]

日本棋院 2016-01-20
売り上げランキング :
by ヨメレバ
NHK 囲碁講座 2016年 02 月号 [雑誌]

日本放送出版協会 NHK出版 2016-01-16
売り上げランキング :
by ヨメレバ

おすすめ記事セレクション