キム・マンス8段"AlphaGoの思考、人間理論体系内にあり"
 
[521385]work-002-98u
 ▲人工知能AlphaGoに2連続敗北にあった後の終局場面。 イ・セドル9段が顔をしかめて敗因を考えている。


イ・セドル9段は崖っぷちに追い込まれた。 

“人工知能AlphaGoに5-0で勝つ。 1局だけ負けてもみな負けたのと違わない。”というイ・セドルの大言壮語は“1局でも勝つ。”という覚悟に変わった。 


 

Googleディープマインドが製作した人工知能AlphaGoは3月9日と10日ソウル、光化門(クァンファムン)フォーシーズンズ ホテルで進行されたディープマインド チャレンジ マッチ イ・セドルvsAlphaGo五番勝負第1局と2局でイ・セドルは黒番で、また、白番で中押し負けした。 

YTNで1、2局を放送解説したキム・マンス8段は記者に“虚しい。 酒をたくさん飲んだ。”と言った。 そうするうちに姿勢をぐっと引き締めた。 “このような時ではない。 AlphaGoが人間思考の範囲を跳び越えたと見る必要はない。 AlphaGoをひたすら持ち上げる必要もなく、無視する必要もなく、ただ淡々とした姿勢でAlphaGoを眺める必要がある。”と話した。 

イ・セドルvsAlphaGo対決はまだ終わっていない。 イ・セドルが勝つにはどのようにしなければならないだろうか。 また、AlphaGoが見せた人工知能的囲碁解釈の本質は何かについて対話をしてみた。 

(記者) “すでに崖っぷちだ。 3対局を全て勝ってこそイ・セドル9段が逆転優勝する事ができる。 ところが展望を暗く見る人が多い。”
 
(キム・マンス8段) “そのはずだ。 私も衝撃を受けたから。 解説してずっと驚いた。” 

(記者) “イ・セドル9段はなぜ負けたのか?”
 
(キム) “イ・セドル9段が相手をあまり分かっていない。 'Zen'、'DolBaram'、'クレージーストーン'のようにAlphaGoより実力は低くてもモンテカルロ メソッドと関連したプログラムと打って練習して見る必要があった。” 

(記者) “代わりにイ・セドル9段は仮想対局を頭の中でしてみたと言わなかったか?” 
 
(キム) “仮想対局よりその方が良かったことと見る。 私は前にZenに何子か置いて打って見たことがあるのだが一度は変則でテストしてみたが負けて、これではないように見えて用心深く定石的プレーをしたのだが負けた。 今のイ・セドル9段がそうだ。 こうなると突然慌てることになる。 相手を似た方式でも経験してみる方がより良かっただろう。”

(記者) “そういえばイ・セドル9段は人工知能と打ってみたことが一度もないと言った。 しかし対局内容がそんなに良くなかったか?” 
 
(キム) “AlphaGoを機械だと考えない方が良いだろう。 イ・セドル9段がまったく別の棋士のように打たない。 AlphaGoの手法が私たちに難しく見えても、私たちの人間が積み重ねた思考体系の枠組みを大きく抜け出していない。 そのまま認めて人間のように考えるのが勝負的により良いだろう。 AlphaGoを奇抜な手を打つ才能あるプロ棋士と見る程度で。”

(記者) “イ・セドル9段も奇抜な手を打つ。”
 
(キム) “イ・セドル9段はもう少し若かった時に本当に他の棋士をびっくりさせる創意的な手をたくさん見せた。 今はむしろAlphaGoが創意的な手を打ってイ・セドル9段を慌てさせている。” 

(記者) “AlphaGoの手が人間にそんなに難なく解釈可能な領域ならば例をあげてみてほしい。” 
 
(キム) “(場面図) 2局から出たカタツキから見よう。 黒1は最も議論になった手だ。 初めにはおかしな手という評価が多かったが対局終了後には囲碁の理論を変えたという話にまで発展した。 しかし黒1の本当に意味はAlphaGoの思考体系を推論して見る事ができる最も重要な資料だと見る。”

 
▼場面図1
01


(参照図1-1)黒1は悪い手なのか? いや、断定し難い。 ところが必ずしも今打つ必要はない。 AlphaGoはなぜこの時点で打ったのだろうか? 今まではAlphaGoがエラーを起こしたことで大きい意味がない雰囲気だったがAlphaGoを認めた状態で、‘私がAlphaGoならば…”としながら考えてみるとそのようなこともあると感じられる。 
▼参照図1-1
1-1



(参照図1-2) 
先に形を見よう。 この定石以後黒が打つことができた手はAとBだ。 
この模様を見れば、プロはこう思う。 'AとBを打てる場合があるのでここで保留しておいて後ほど周辺状況に合わせよう。'
▼参照図1-2
1-2



(参照図1-3)
ところがプロの囲碁でも黒1に近寄る場合はとても珍しい。 白の形がしっかり固まって黒1に近付いた以後利益を見る場合がない。 
▼参照図1-3
1-3



(参照図1-4)
AlphaGoはAとBの勝率期待値を計算してみて統計を出した時、実戦の黒1で打つのが勝率が高いと判断しただろう。 結局プロにAlphaGoに(参照図1-3)黒1は良くなくて、(参照図1-4)も黒1が正手という結論は同じだ。 ところが、人は後で打つのだがAlphaGoは今打った。 
着手時期が違うだけ、善悪は差がない。 ところが人はAlphaGoの黒1が悪いという感情に包まれる。 実は悪い手でないのですが。 
▼参照図1-4
1-4



(参照図1-5)
ここでの論議の一手を分析してみよう。 黒1も似ている。 じっくり考えてみれば、黒1は十分に打つことができる。 
プロが打たない手でなく、プロが打つ事もあることだ。 
▼参照図1-5
1-5



(参照図1-6)
黒1で打って、白2で受ければ黒3に打つ手法が明確にある。 白6まで進行と実戦進行の差はぴったり一つ。 黒1、白2が交換されなかったという点だ。 
それでは…。 AlphaGoはなぜ黒1と白2の交換が必要でないと考えたのか?
▼参照図1-6
1-6



(参照図1-7)
先に、AlphaGoは既存の囲碁体系を押し倒したことでないという点を明らかにしたい。 ここで黒1、3で打つ手はプロも悪い選択だと感じる。 それでこのように打たない。 
▼参照図1-7
1-7




(参照図1-8)
一般的にプロも右辺の価値を高く見ない。 実際に黒1に打って5まで進行されたと見れば…黒が得したと判断する。 Aの辺よりBの中央の価値が高くみなされることだ。 
▼参照図1-8
1-8




(参照図1-9)
それで黒1に打って白は手を引く。 すなわち、AlphaGoも人も右辺の価値を高く見ないという判断は全く同じだ。 それで黒1で打ったり、でなければ1-6図のように処理するが、AlphaGoは手順一つを省略しただけだ。 
▼参照図1-9
1-9



整理すれば、最初AlphaGoが打つ手に対しては理論自体が違ったのではない。 判断は同じだ。 すなわち、AlphaGoが打つ手にあまり慌てる必要はないということだ。 
 
打つ時期が違う。 (参照図1-1)も黒1が重要な鍵だと見るのは、AlphaGoが黒1に打ったとすればAlphaGoは右辺を重く見ないという意味だと解釈しなければならないためだ。

すなわちAlphaGoの手でAlphaGoの考えを読むべきなのだが、AlphaGoはとてもはやく決める。 これがAlphaGoを分析する最も重要な“鍵”がではないか?

3局~5局は労力のいる戦いになるだろう。 今AlphaGoが打つ手を理解する事はとても難しい。 囲碁は復碁を通じてお互いの思考を交わすが、今AlphaGoは人間と交流がない。 グーグルが後にでもAlphaGoがなぜこのような手を打ったのか、思考決定体系を公開すれば良いだろう。 
残った三対局孤独な勝負を展開するイ・セドル先生を静かに応援する。” 


(記者) “風があるならば、イ・セドル9段が自身の長所を生かしたら良いということだ。 積極的に戦って乱戦に導くのがより良いだろう。 1局はちょっと序盤に流れが絡まってAlphaGoの鋭い攻撃に機会がなかったと見なければならないようで2局はイ・セドル9段にふさわしくなく果敢でなかったようだ。 

AlphaGoは既存のモンテカルロ メソッドに深層神経網アルゴリズムを結合した形態だ。 人工神経網がモンテカルロ ツリーナビゲーションの失敗を補完するが神経網が完ぺきに与えることはできないだろう。

モンテカルロは本来色々な場所で同時多発的に現れる乱戦に弱いのが最も大きい弱点として選ばれていた。 事実Googleディープマインドも深層神経網で探索する深さと範囲を減らして正確度を高めようと努力した。 ところが、AlphaGoが生きてない石何個かがからまった接戦でどれくらいよく打つかは未知数だ。 1、2局をたどりながら関心を持ってみられなかった。 そうしたのはイ・セドル9段の長所なのだが。 
 

ずっと負けるかも知れない。 結果が分からない。 しかし私はまだしてみるだけのことはあると見る。 プレスブリーフィングでディープマインド デミス・ハサビス博士は“ディープマインド内部的に把握しているAlphaGoの弱点があったりするがイ・セドル9段との対局が行われる前の時点で申し上げることは困難である。”と話したことがある。 
 
弱点があることはあるという話だ。

また、2局が終わった後“AlphaGoは対局する間自身の力量の最大値を発揮し限界点に到達するもした。”とした。 重要な手がかりだ。 同時多発的な乱戦が行われるならばAlphaGo力量の範囲を抜け出すことができるかも知れなくないか。 

コウを積極的に活用してみるかに関してはよく分からない。 10月バージョン AlphaGoはコウ争いを立派に行った。 利害得失計算も正確だったし損するコウ材も使わなかった。 起伏があるかは分からないが今回もAlphaGoはコウ争いをよくやり遂げる可能性があるという話だ。 

今回の結果がどうなろうがうれしいことはAlphaGoが見せた人工知能の創意的手法が人間思考の地平を広げる役割をすると見る。” 
 
原文記事:キム・マンス8段"AlphaGoの思考、人間理論体系内にあり"