一般注記本研究は「囲碁における情報工学的アプローチ」をテーマとしている.現在も囲碁で用いられているモンテカルロ法に関連した機械学習法,Simulation Adjusting の提案(第I 部) と,畳み込みニューラルネットワークを用いた棋力推定の提案(第II 部) が二大テーマである. 囲碁AI(Arti_cial Intelligence,人工知能)の研究は1960 年代に始まったが,その棋力は,2005 年頃まで平均的なアマチュアプレイヤーにすら及ばなかった.そのような状況で,囲碁におけるモンテカルロ法の有効性が2006 年頃から知られ始め,囲碁AI の棋力は急速に伸び,2012 年頃にはアマチュア上級レベルに達した.しかし,2012 年頃から2015 年頃まで,囲碁AI の棋力は再び停滞した. その状況を打破しようと,モンテカルロ法のシミュレーション部の新たな学習手法として提案した手法が,第I 部で述べるSimulation Adjusting である.これは,モンテカルロ法を用いたAI が返す手が,人間の上級者の手と一致するように,シミュレーションの方策を調整していく手法である.既存研究にSilver らによるSimulation Balancing があるが,Simulation Balancing が「教師となるモンテカルロAI」から学習するのに対し,Simulation Adjusting は「上級者の棋譜や問題集」から学習する点が異なる. Simulation Adjusting の実験では,最終的には5 路盤の問題集での安定した目的関数の減少と正答率の向上を確認できた. 一方,2012 年にDCNN(Deep Convolutional Neural Network,階層の深い畳み込みニューラルネットワーク)を用いたシステムが画像認識のコンペティションでブレイクスルーを起こした.その後,囲碁の盤面認識にもDCNN が有効なのではないかと言われ始め, 2014 年頃から徐々に,DCNN が囲碁の着手予測にも有効であるという研究が発表され始めた.2016 年にGoogle 社のDeepMind チームが発表したAlphaGo は人間のトッププレイヤーに初めて勝利を収めたが,これには,DCNN が決定的な役割を果たしている. 第II 部では,CNN(Convolutional Neural Network,畳み込みニューラルネットワーク)の局面認識能力を活用し,一局の棋譜のみからの棋力推定に関する研究を述べる. プレイヤーの棋力を少数の棋譜からコンピュータが自動的に推定できるようになれば,インターネット碁会所の運営などにたいへん役に立つと考えられる.また,実際に人間の上級者は一局の棋譜のみからプレイヤーの棋力をかなりの精度で推測できると言われており,この研究は人工知能の観点からも興味深い. コンピュータによる棋力推定に関する既存研究は囲碁を含めていくつか存在したが, CNN を使用したものは当時は見当たらなかった.我々の研究ではDCNN のライブラリであるCaffe を用いた棋力推定のシステムを構築し,インターネット対局場「囲碁クエスト」の13 路盤の棋譜を用いて,どれくらいの精度で棋力を推定可能かを調べる実験を行った.その結果,適合誤差を既存研究より小さくすることができた.この結果より,畳み込みニューラルネットワークは,AI の棋力向上だけでなく棋譜からの棋力推定にも有用であると分かった.
2016
コレクション(個別)国立国会図書館デジタルコレクション > デジタル化資料 > 博士論文
受理日(W3CDTF)2017-07-03T04:10:06+09:00
連携機関・データベース国立国会図書館 : 国立国会図書館デジタルコレクション