タイゼム - 大韓民国1位囲碁サイトTYGEM.COM
デミス、"囲碁を征服すれば世界を得る!"
Googleディープマインド デミス・ハサビスCEO発表内容

 152821DSC_9438
▲画像でリンクされたモニター画面でイ・セドルと手をあわせて親指を上げて見せたGoogleディープマインドのデミス・ハサビスCEO。 

イ・セドルとAlphaGoの'100万ドルマッチ'が世界最高の話題のうちの一つになった中でGoogleディープマインドのCEOデミス・ハサビスが対局に関連した詳細内容を記者会見を通じて発表した。

デミスは記者会見終わりに今回の対決を通じて囲碁が西洋世界にさらに多く知らされる機会になったら良いという言葉と共に、グーグルがなぜ最も難しいといわれている囲碁という種目を選択してAIと人間の対決を推進しているのか核心的な内容を説明した。

読みと価値判断など最も複雑で難しい問題解決過程を経て次の着手を選択しなければならない囲碁の特性上、もしAIがこの分野を征服できるならば世の中で発生する多様な難題を解決するプログラムを作ることができるという話がデミスのプレゼンテーション中最も核心的な内容だった。

タイジェムではGoogleディープマインドのデミス・ハサビスCEOが記者会見でした話の主な部分を編集して会員たちに提供する。

 152938DSC_8898
▲ デミス・ハサビスCEOが英国から画像を通じて発表をしている。  
 

"直接ソウルに行って記者会見することができなくて申し訳ない。 最後の瞬間までAlphaGo改善作業に最善を尽くすためにやむをえず今回の記者会見は韓国に直接行く事ができなかった。 だが、私どもは2週ぐらい後、韓国に行って皆さんにお会いすることを大きく期待している。 

囲碁はコンピュータが挑戦できるゲーム中最も難易度が高いゲームとして比喩された。よくする例えで場合の数が宇宙の原子の数より多いというほど難しい。すぐにこのような理由のために人工知能コンピュータ プログラムには二種類が重要だ。私たちがpolicy networkとvalue networkと呼ぶものだ。


一般的に考えてみた時、チェスの試合に比べて囲碁は10倍も多い場合の数ができる。

その上コンピュータで評価をする(evaluation)機能を発揮して黒と白 どちら側が勝つことになるかを計算するのは不可能だと感じた。このような問題を克服するために私どもは神経網二つ(policy networkとvalue network)をトレーニングする作業を始めた。 

最初にpolicy networkを開発して活性化させてプロ棋士が打つことと同じ、すなわち人間の専門家がする活動を模倣する作業を遂行した。

その次の段階でこのシステムを追加的に学習訓練させて自ら対抗するようにして碁を打つようにさせた。 一人で約3000万回の練習を繰り返すようにさせた。

その後3000万局の一つ一つの手を全て集めて新しいデータを構築するに至った。 チェスとは違い自ら学習して習っていく方式を採択したのだ。 結局は人間がする方式のとおり囲碁に対して習わせたわけだ。 

皆さんもよくご存じなように私どもの次の挑戦課題は約2週間後イ・セドル9段と対決を行うことだ。 伝説的なイ・セドル選手とともにこのような対決を行うのは私どもとしてはものすごい光栄だ。

私どもがネイチャー誌に発表した論文を通じても多くの関心を集め、この対決発表を通じて多くの方々が興奮している。 皆さんにソウルでお会いするに事になると思うと私どももまたときめく。

イ・セドル9段とAlphaGoの対局は制限時間各2時間に1分秒読み3回、コミは7目半であり中国ルールで進行される。 中国ルールで進行される理由はAlphaGoが初期開発段階で中国ルールをベースに研究されて、イ・セドル選手との対局を控えて韓国ルールで再びプログラミングするには時間が迫っているためだ。

今回のチャレンジ全試合はYouTubeを通じて生中継されて、西洋人のうちで唯一プロ9段を取得したマイケル・レドモンドの英語解説で進行される。



韓国ではユ・チャンヒョク、キム・ソンリョン、ソン・テゴン、イ・ヒョンオクなどプロ棋士が生中継をする予定だ。

3月8日午前10時に試合前公式記者懇談会を開催する。 また、チャレンジ期間の間、毎日試合後記者懇談会が開催される予定だ。

韓国でイ・セドル9段と皆さんに会う予定なのですが既にときめいている。

追加として、私どもがなぜこのような努力をしているのか申し上げる。 今回のチャレンジの結果を別にしてGoogleディープマインドで進めるこのような努力はさらに知能化されたシステム開発のためだ。 

AlphaGoを開放する時、適用した方法論は汎用的な方法論であるからいつか世界の実質的な難題に適用できると期待される。 もちろんその場合はスマートフォンをより良くさせる等、さらに早く適用されて使われるだろう。

だが、長期的に見た時、科学者に最も難しくて緊急な難題、複雑な病気治療分析作業や気候変化と関連した難題を解決する事に適用できると期待する。

今回の機会を共に用意して参加された韓国棋院とイ・セドル9段にこの席を持って感謝の言葉を差し上げたい。 今回のチャレンジを通じて囲碁が世界の人々、特に西洋にさらに多く知らされて発展する事を希望する。"(Googleディープマインド デミス・ハサビスCEO)


※policy networkとvalue networkに対するデミスCEOの補充説明
 
囲碁は場合の数があまりにも多いので無作為形態の代入方式で手を見つけるのは勝利し難い。 全世界に最も大きい規模のスーパーコンピュータがあるといっても、またはより良いスーパーコンピュータが出てくるといっても充分ではない。 それで囲碁で打つことができる場合の数を最大限、すなわち無限大に広げてみると仮定した時、AlphaGoは'policy network'と'value network'という二つの神経系を活用して可能なすべての場合の数を減らしていく作業をする。

最初の神経系であるpolicy networkを使ってどのように打つのが勝利の可能性が高いのか提案をする事になる。 この時探索ツリーが無限大に繰り広げられるのではなく可能性が高い手が選ばれることになる。 二つ目の神経系であるvalue networkではその手が黒と白にどのくらい良い手になるのかを話すことになる。 それで全体的な探索の深さを減らしていくことだ。

一例として比較するなら、チェスでディープブルーがカスパロフに勝った時は一手を打つ前に2億回の可能性を探索した。 だが、AlphaGoは一手を打つ前に10万回検討するようになっている。

事実10万回だとすれば、人が打つことに比較して多いことは多いがコンピュータとして問い詰めればはるかにたくさん選ばれたものだ。 普通の人は1000回未満の手を探索する。 AlphaGoが二つの神経系を通じて次の手を探すのでこういう結果が出ることだ。

 153138DSC_8959
▲ デミス(左側)が画像を通じて200人余りの取材陣が入った韓国棋院記者会見場(右側)の状況を見渡している。

153215DSC_9312

▲反面英国記者会見場には 10人を少し越える記者たちが訪問して大きい対照をなした。英国現地時間では午前8時という早い時間だと。

153335DSC_9136
▲記者会見中微笑を見せたイ・セドル(左側)。AlphaGoとの対決が2週先に迫った。 
原文記事:タイゼム - 大韓民国1位囲碁サイトTYGEM.COM 



タイゼム - 大韓民国1位囲碁サイトTYGEM.COM 

124726DSC_9253
123531DSC_9332
123435DSC_9326
123347DSC_9368
123250DSC_9457
122554DSC_9104
122514DSC_8935
122446DSC_8976
122416DSC_8898
122347DSC_8883
122243DSC_9085
12355DSC_9403

月刊碁ワールド 2016年 03 月号 [雑誌]

日本棋院 2016-02-20
売り上げランキング :
by ヨメレバ
NHKテキスト 囲碁講座 2016年 03 月号 [雑誌]

NHK出版 2016-02-16
売り上げランキング :
by ヨメレバ



おすすめ記事セレクション