AlphaGoの論文
にょーん!みらのたんです!おはようございます!おひさしぶりです!9か月ぶりの更新となってしまいましたが...わたくしみらのたんはテレビに出たりアメリカに行ったり踊ったりテレビに出たりしておりましたwそれはそうと、コンピュータ(AlphaGo)が欧州チャンピオンを破ったことが話題になってますね(・ω・)モンテカルロでもなかなか大変っぽい話だったのに、いきなり強くなったなコンピュータwwって思って、Natureに掲載された論文をこっそりげっとしまして、のんびり訳しております。Abstractだけ一応なんとか訳せたのでメモがわりにおいておきますね。ところどころ日本語がおかしかったり、意味がちょっと変わっているかもです()--------------------囲碁のゲームは長い間、その巨大な探索空間と盤面や着手について評価することが困難であるために、人工知能にとって最もやりがいのある古典的なゲームであると見られている。ここでは、形の評価をするための「バリュー・ネットワーク」と、着手を選択のための「ポリシー・ネットワーク」を用いたコンピュータ囲碁への新しいアプローチを紹介する。これらのディープニューラルネットワークは、プロの対局からの学習および自己対局などによる強化学習という新しい組み合わせによって訓練されている。ニューラルネットワークは任意の先読み検索なしに、自己対局によりランダムに数千のゲームをシミュレートする最先端のモンテカルロツリー探索プログラムのレベルでの対局を果たしている。また、バリューおよびポリシー・ネットワークとモンテカルロシミュレーションを組み合わせた新しい検索アルゴリズムを紹介する。この検索アルゴリズムを使用して、我々のプログラムAlphaGoは、他の囲碁プログラムに対して99.8%の勝率を達成し、ヨーロッパ囲碁チャンピオンを5勝0敗で破った。コンピュータプログラムがフルサイズ(19路?) の対局で人間のプロ選手を破ったのは今回が初めてで、これは以前考えられていたよりも少なくとも10年は早い。--------------------うーん。。。みらのたん化学系の人なのでちょっと難しいんですけど...とりあえず、2つの方法を組み合わせたら強くなったよって話ですかね.まだよくわからないので、あとからintroductionとか訳していこうかなって思ってますwイセドルさんと対戦するとのことなので楽しみですねー!ではでは、大会に出るためにちょっくら広島行ってきますw