大将軍(たいしょうぐん) アピール文書 ○大将軍の概要  評価関数に主眼をおいた将棋ソフトです。  過去には4駒の位置関係を評価関数に使用していました。  しかし、電王トーナメントのメモリ搭載量の制限や、学習作業の効率を考慮し  現在は3駒関係の評価関数を用いています。 ○大将軍の特徴  評価関数の作成に関しては、以下の点を工夫しています。  (評価関数は、以下の2ステップの手順にて学習しています)   1.プロの棋譜からの学習   ・いわゆるBonanzaメソッドをベースに、手番の評価やミニバッチの手法を取り入れています。   ・ミニバッチを用いることで、学習が安定し、短時間で学習の成果を確認することができます。   ・手番に関する評価は、3駒に手番加えたkkpt型を採用しています。kppt型よりも計算コストが小さいため、    15%程度探索速度が向上します。  2.自己の探索結果からの強化学習   ・プロの棋譜からの学習において勝率が飽和したところで、浅い探索結果と深い探索結果の評価値を用いて、    評価値の不整合を修正していきます。   ・学習する局面により勝率に影響するようですが、とのように設定するとよいかは今後の課題です。 ○ライブラリの使用  やねうら王を使用しています。  探索部分は基本的にライブラリを用い、開発は評価関数と学習に注力しています。