HANGAME
[AlphaGo]AlphaGo、イ・セドルの時より三子強くなった

 0524-a51
▲デミス・ハサビス GoogleディープマインドCEOが人工知能フォーラムで講演している。


コ・ジェと対決するAIは'AlphaGoマスター' 
1年前イ・セドル時のアップグレード バージョン

'AlphaGoマスター'。 コ・ジェ9段と対決を行っている人工知能囲碁プログラムは初期の'AlphaGo'でもなくて新しいバージョンの'AlphaGo2.0'でもない'AlphaGoマスター'であった。 

24日、中国浙江省烏鎮の国際コンベンションセンターで開かれた'人工知能フォーラム'でAlphaGo開発チームのデービッド シルバー博士がこのように明らかにした。 年末年始インターネットワールドで盤上強者を相手に60連勝を上げたそのプログラムだ。

当時マスターは突然現れて、強者だけ選んで60対局を打って60勝をおさめた後突然消えた。 身分を隠したまま対局を行った人工知能は、結局万人の予想通り'最新版AlphaGo'であることが判明した。 

 0524-a52
▲デミス・ハサビスCEO。

マスターは昨年イ・セドル9段と対決したAlphaGoのアップグレード バージョンであり、その後4ヶ月位すぎてコ・ジェ9段の前に現れたAlphaGoマスターは、マスターのアップグレード バージョンだ。 イ・セドル時のAlphaGoが、自分たちどうしで対局を行う強化学習で実力を伸ばしたのだ。

人間の棋譜の助けを受けず、初めから自らの学習を通じて棋力を練磨したいわゆる'AlphaGo2.0'が登場するという一部報道は推測に過ぎなかった。

'AlphaGoの父'と呼ばれるデミス・ハサビス ディープマインドCEOは年初の講演で'事前知識なしで囲碁を習う二回目のシステム開発'に対して言及したことがある。 

 0524-a53
▲人工知能フォーラムに入った観衆。

既存の改良バージョンと明らかになって、コ・ジェ-AlphaGoの対決の意味が半減した感じを消すことはできない。 棋力を練磨して対戦相手を変えたことに違わない。 コ・ジェとの初めての対局で、以前より明確に注目するほどの手が見られなかったことも従来バージョンの改良版であるためであると解釈される。

AlphaGoマスターはヨセで失敗を犯したりした。 容易な場面でも最善の手を打たなかった。 それで差が半目まで狭まった。 この部分に対して'勝利自体'に目的を置いているAlphaGoに何目差で勝つかの'スコア'は重要ではないと話す。

 0524-a54
▲デービッド シルバー博士。

勝利確率を最大化する方式で設計されたので、もっと大きい点差で勝とうとすると不確実性が高い果敢な手を打たないで、勝利が確実視されれば格差が狭まっても安定的に処理するということだ。 それでミスとも映る手を打ったりするということ。

この日、デービス・シルバーGoogleディープマインド リサーチ サイエンティストはまた、"60連勝した時のAlphaGoマスターは、昨年イ・セドル9段と対局した時のAlphaGoに三子で勝つ実力"と明らかにして一座を驚かせた。

 0524-a55

だが、AlphaGoマスターは'漠然と三子'と話すだけ1局の時より多いものを見せなかった。 イ・セドル9段の言うように場面場面ごとに最善の手を最後まで見つけて打つならば人間にさらに役に立たないだろうか。

一方、総三回の対決を広げるコ・ジェとAlphaGoマスターは25日2局を、27日3局を打つ。 2局ではコ・ジェが白を握る。 34連勝をおさめるなど'無敵の白番'を誇示してきたのでもう少し期待を持つようにする。

 0524-a56

原文記事:HANGAME 


250