HANGAME
原文記事:HANGAME[AlphaGo] 'イ・セドル AlphaGo'に100戦100勝、自ら習った'AlphaGoゼロ'出てきた▲人工知能(AI)囲碁プログラム'AlphaGo'が自らアップグレードした。Googleディープマインドは人間の教えや既存のデータなしのゼロベースで自ら学習した'AlphaGoゼロ'を公開した。写真はイ・セドル-AlphaGoの対局の姿。Googleディープマインド、新しいAlphaGo公開'セルフ囲碁'打って自ら体得イ・セドル9段や、コ・ジェ9段と対決を行った'AlphaGo'を凌駕する新概念の人工知能囲碁'AlphaGoゼロ'が出てきた。
既存のAlphaGoプログラムが棋譜など人間知識の助けを受けたことと違い、AlphaGoゼロは自ら囲碁を悟って既存AlphaGoを圧倒する能力を備えた。Googleディープマインドのデミス・ハサビス最高経営者をはじめとする研究員はAlphaGoゼロのアルゴリズムとテスト結果等を含んだ'人間の知識なしで囲碁をマスターする(Mastering the game of Go without human knowledge)'題名の論文を科学学術誌'ネイチャー'に韓国時刻19日に発表した。'0'から新しく始めたという意味で名前が付けられたAlphaGoゼロ(AlphaGo Zero)は囲碁ルールの他には何の事前知識がない状態から出発した。 'セルフ囲碁'を打って自ら体得したのだ。 これまでのAlphaGoは膨大な量のデータを通じて学習し、人間強者との対局をたどりながら実力を育てた。それに比べてAlphaGoゼロは勝率を高める手がどんなものなのかを自ら悟って関連データを蓄積して実力を高めた。 このような学習方式は犬に餌を与えて"座れ'等、特定の行動を訓練させるのと似ている。AlphaGoゼロは独学36時間で、昨年3月'Googleディープマインド チャレンジ'でイ・セドル9段を4対1で勝った時のAlphaGoの実力を越え、72時間独学した後には当時と同一に制限時間2時間で対決した結果100戦100勝をおさめた。
AlphaGoゼロが1手に0.4秒かかる'超早碁'で490万局を一人で打って研究した結果だ。▲デミス・ハサビス最高経営者をはじめとするGoogleディープマインドの開発チーム。40日にかけて一人で2900万局を打った後には、5月'囲碁の未来サミット'でコ・ジェ9段に3対0で勝った'AlphaGoマスター'と100対局を打って89勝11敗を記録した。AlphaGoゼロが既存のAlphaGoより強い理由に対して研究陣は、"人間知識の限界にこれ以上束縛されないため"と説明した。
人間から全く習ったことがないので人間の先入観と限界にしばられないということだ。 AlphaGoゼロは独学過程で人間の定石を自ら悟ったり独創的な定石を開発することもした。デミス・ハサビス最高経営者は、"AlphaGoゼロは人が作ったデータを入力しなくても良くて、コンピューティング パワーも、弱い人間の限界を跳び越える人工知能研究の重要な道しるべになるだろう"と明らかにした。
nitro15@nitro155
【AlphaGo】棋譜なしで独学したAlphaGo、最も強かった Googleディープマインド'AlphaGoゼロ'バージョン公開 https://t.co/E7Q5J835Kw
2017/10/19 11:18:28