2chまとめのまとめ速報

2chまとめのまとめ速報

囲碁のトップ棋士に勝った人工知能「DQN」の正体wwwwwwwwww

   

囲碁のトップ棋士に勝った人工知能「DQN」の正体wwwwwwwwww

04

1: シャチ ★@\(^o^)/ 2016/04/16(土) 10:13:53.67 ID:CAP_USER*.net
毎日新聞 4月16日(土)10時10分配信
http://headlines.yahoo.co.jp/hl?a=20160416-00000031-mai-soci
3月9〜15日に韓国のソウルで、100万ドルを懸けて人間対人工知能の囲碁対局が行われた。
結果は人工知能「AlphaGo(アルファ碁)」が、韓国人プロ棋士イ・セドル九段に対し4勝1敗で勝ち越し、
囲碁界のみならず各方面に大きな衝撃が走った。アルファ碁とそれを育てた学習アルゴリズム
「DQN」(Deep Q-Network)について、グーグル日本法人元社長・辻野晃一郎さんが解説する。

 ◇アルファ碁を開発したベンチャーの実力
 この対局の前にも、昨年10月、アルファ碁は欧州チャンピオンで中国出身のファン・フイ氏と対戦し、
5戦全勝した。ファン氏は中国で二段の腕前なのに対し、イ九段は文句なしの世界トップクラス棋士だ。
「魔王」とも呼ばれ、定石にとらわれない独創的かつ攻撃的な棋風で知られている。そのイ氏が、
「無力な姿を見せて申し訳ない」と肩を落とした。

 アルファ碁を開発したのは、2011年に設立された英国の人工知能ベンチャー「Deep Mind」(ディープマインド)だ。

 ディープマインドは、グーグルとフェイスブックとの間で買収合戦となり、14年にグーグルに買収された。
買収金額は5億ドル以上といわれる。天才創業者デミス・ハサビス氏の獲得が目的とされたが、
グーグルの期待通り、ディープマインドは、機械学習と脳神経科学を応用した画期的な汎用(はんよう)
学習アルゴリズム「DQN」を発表し、世間を驚かせた。このDQNをもとに、アルファ碁が作られた。

 動画投稿サイト「YouTube(ユーチューブ)」などを検索すると、ブロック崩しゲームの元祖である「ブレイクアウト」を、
DQNにプレーさせている様子を撮影した動画が見つかる。最初はまったくの初心者レベルだった状態から、
数時間で自己学習しながらみるみる上達していく様子がわかる。あげくには、
DQNの設計者も知らなかったゲーム攻略法を自ら編み出してしまう。

 「スペースインベーダー」をプレーさせている動画もある。初めはすぐにやられてしまうのだが、回数を重ねるうちに、
どんどんコツをつかんで、最終的には無駄な弾撃ちをすることなく、ハイスコアをたたき出すようになる。

 ◇人工知能を巡るこれまでの動き
 米コンピューター大手IBMのチェス専用ソフト「ディープブルー」がチェスのチャンピオンに勝ったのは1997年のことだった。
将棋でも既にコンピューターがプロと互角以上の実力を持つに至っている。

 しかしこれらは、可能性のある局面をすべて計算し、最適な一手を探すという高度な力技のプログラムだ。
盤面が広く打ち手の選択肢がはるかに膨大な囲碁は情報ゲームの最高峰といわれ、このような手法では当面攻略は不可能だ。

 そこで、アルファ碁は、人間と同じように、対局を重ねるたびに自己学習しながら強くなっていく人工知能として作られた。
DQNを囲碁というゲームに適用したのだ。囲碁でコンピューターが人間に勝てるようになるのはまだ10年は先といわれていたので、
今回の勝利は、人工知能研究を軽く10年は前倒しした快挙ともいえるものだ。

 かつて日本は82年から92年にかけて、「第5世代コンピューター」と銘打ち、国家プロジェクトとして人工知能研究を
推進した歴史がある。意欲的なプロジェクトではあったが、世間的な評価は失敗だった。

 先行者優位性を生かせないまま時代は変わり、「深層学習(ディープラーニング)」が登場して、人工知能研究は
完全に世代が代わった。今はこの分野でもインターネットを制したグーグル(持ち株会社「アルファベット」を設立し、
現在はその傘下)が圧倒的な競争優位に立ち、ディープマインドの獲得をはじめ、世界中から天才を集めている。
(以下ソースで)

引用元: ・【囲碁】トップ棋士に勝った人工知能「DQN」の正体

続きを読む

 - その他