ハンゲーム - 楽しい、カンマ、Goハンゲーム!
[話題]イ・セドルに挑戦状投げた人工知能'AlphaGo'とは?

■グーグル ディープマインドのデミス・ハサビスCEOが伝える'AlphaGo' 

イ・セドル9段とコンピュータが対決するというニュースが囲碁界の熱い論点として浮び上がった。 韓国時間27日明け方科学雑誌ネイチャー紙に紹介された通りグーグルが2014年買収した人工知能企業'ディープマインド'がマシンラーニング技術を基に人工知能プログラム'アルファゴ(AlphaGo)'を開発してヨーロッパ囲碁チャンピオン樊麾を5対0で破る成果を上げた。

合わせて3月には10余年間世界囲碁界の最強者として君臨しているイ・セドル9段にAlphaGoが挑戦する。 囲碁最高手と人工知能間の囲碁対決が行われることになることだ。 チェス、将棋とは違い人工知能が征服できない未知の分野である囲碁に挑戦状を投げた'AlphaGo'というのは果たしてどんなプログラムであろうか。

28日午後5時グーグルコリア会議室で開催される記者会見に先立ち'AlphaGo'を開発したグーグル ディープマインドの共同創業者でありCEO(最高経営者)のデミス・ハサビス(40)が送ってきた下の文を紹介する。

 0128-a1
▲人工知能プログラム'AlphaGo'の論文が発表された国際学術志'ネイチャー'の表紙(ネイチャー提供)。


囲碁は2500年余り前に中国で始まったゲームです。 孔子も囲碁に対して文を書いたことがあって、囲碁は美学的価値を認められて真の中国学者ならば備えなければならない技芸のうちの一つとして見なされてきました。 全世界4000万人以上が楽しんでいる囲碁の試合ルールは簡単です。

囲碁棋士は碁盤の上の白い石、あるいは黒い石をかわるがわる置いて相手側の石を取り出したり空いた空間を囲んで'地'を作ることが目標です。 碁を打つ時には主に直感的な感じが作用することになって、このような美しさ、微妙さ、そして知的深さによって囲碁は去る数百年間人類の想像力をひきつけました。

だが、ルールは簡単かもしれないが実際には囲碁はとても複雑なゲームです。石を打つ場所は何と1,000,000,000,000,000, 000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000, 000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000種類の場合の数が存在します。 これは宇宙にある原子の数より多くて、チェスと比較する時場合の数が10の100乗以上多いのです。

このような複雑性はコンピュータが碁を打つ事をとても難しくさせて、したがって人工知能を研究する人々にとても魅力的な挑戦課題として作られました。 これらは普通各種問題を人と似た方法で解決する能力がある、よりスマートで柔軟なアルゴリズムを開発するためにゲームをテスト道具として使います。

コンピュータがマスターした最初のゲームは1952年の'スギドロップ(三目並べとも呼ばれる)'(※訳注:○×ゲーム)でした。 その後1994年にはチェッカーをマスターし、1997年にはディープブルーコンピュータがチェスで勝利をおさめました。 

コンピュータの活躍はボードゲームで終わらなかったのです。 IBMのワトソン(Watson)コンピュータは2011年'ジェパーディ(Jeopardy)'で優勝し、2014年にはディープマインドが自主開発したアルゴリズムがピクセル入力値だけでアタリ(Atari)社の色々なゲームをプレーする方法を学習しました。 だが、囲碁は今まで人工知能研究者をずっと挫折させました。 コンピュータの囲碁実力はアマチュア棋士水準に過ぎませんでした。

すべての可能な位置に探索ツリー(search tree)を構成する伝統的方式の人工知能は囲碁だけは光を放つことができませんでした。 それでディープマインドは他の処理方式を取りました。 'AlphaGo'というシステムを構築したのですが、これは高級ツリー探索と深層神経網(deep neural network)を結合したのです。 

この神経網は数百万個の神経細胞のような連結の輪を含む12個のプロセス レイヤーを通じて碁盤を分析します。 'ポリシーネットワーク(policy network)'と呼ぶ一つの神経網が次に石を打つ位置を選択します。 'バリューネットワーク(value network)'と呼ぶまた違う神経網は勝者を予測します。

ディープマインドでは専門家がプレーするゲームから3000万個の動きに対して神経網を訓練させました。 これで57%の確率(過去記録は44%です)で人の動きを予測することができるようになりました。 

 0128-a2
▲ 'AlphaGo'を開発したグーグル ディープマインドのCEOデニス・ハサビスが囲碁のアルゴリズムに対して説明している(ネイチャー提供)。



もう次の目標は人をまねるのではなく、実際の対局で人に勝つのです。 このためにAlphaGoは自らの神経網間に数千万回の碁を打って、強化学習という試行錯誤プロセスを使って連結の輪を調整することによって自ら新しい戦略を発見する方法を学習しました。 もちろんこのためには強力なコンピューティング能力が必要だったためにグーグル クラウド プラットホームを幅広く活用しました。

その後AlphaGoを実際の対局に投じてテストを施行しました。 先に人工知能研究の先鋒にある最高の囲碁プログラムらとAlphaGoの間のトーナメントを進めました。 AlphaGoは合計500回対局のうちただ一度を除いたすべての対局で勝利しました。 

次に、12才で囲碁界に入門した後、ヨーロッパ囲碁大会で3回優勝した天才囲碁棋士樊麾(Fan Hui)をディープマインド ロンドン本社で招待してAlphaGoとの対局を進めました。 去る10月秘密裏に進行されたこの対局でAlphaGoは5回全て勝利をおさめました。 コンピュータ プログラムがプロ囲碁棋士に最初に勝った瞬間でした。 この試合に対する詳細な内容は今日の科学雑誌ネイチャーに掲載されたディープマインドの論文でご覧になることができます。

次の段階は何でしょうか? 来る3月AlphaGoは究極的な挑戦を迎えることになります。 伝説的な囲碁棋士イ・セドル9段との対局です。 イ・セドル9段は去る10年の間世界最高の囲碁棋士と認められてきました。

囲碁をマスターすることによって人工知能の大きい挑戦課題の中の一つを解決することになって非常に感激です。 だが、この成果が大きい意味を持つ理由はAlphaGoが囲碁のルールを一つ一つ直接入力して開発された専門家システム(expert system)でなく一般的なマシンラーニング技術を使って自ら囲碁で勝つ方法を把握したとのことです。 

ゲームは人工知能アルゴリズムをはやくて効率的に開発してテストしてみることができる良いプラットホームですが私どもは窮極的にこの技術を重要な現実世界の問題に適用することを望みます。 

AlphaGoに使われた方法は全て汎用性を持っているのでいつか気候モデリング、複合性疾患分析など今日の社会の難しくて頭が痛い難題を解決する事に使われることを期待してみます。 今後人工知能技術を活用してどのような問題を解決することができるか本当に期待されます。 
 
原文記事:ハンゲーム - 楽しい、カンマ、Goハンゲーム! 

人工智能AlphaGo将约战李世石 奖金高达100万美金 - 中国棋牌网 

a697ad83jw1f0ez6gfah2j20go0grmz4


動画(※リンク先音注意)
设计团队解密谷歌围棋 神经网络完善搜索树|谷歌|围棋|棋牌|李世石|综合体育_新浪视频 

関連リンク










関連記事



コンピュータ囲碁 ―モンテカルロ法の理論と実践―

美添 一樹,山下 宏 共立出版 2012-11-10
売り上げランキング : 55220
by ヨメレバ

おすすめ記事セレクション
お知らせコーナー

囲碁4コマ漫画「クロセンシロシ」Kindle版販売中!

クロセンシロシ[Kindle版]

nitro15 2015-12-10
売り上げランキング :
by ヨメレバ


LINE囲碁スタンプ販売中!
250