大将軍（たいしょうぐん） アピール文書

○大将軍の概要
　評価関数に主眼をおいた将棋ソフトです。
　過去には4駒の位置関係を評価関数に使用していました。
　しかし、電王トーナメントのメモリ搭載量の制限や、学習作業の効率を考慮し
　現在は3駒関係の評価関数を用いています。

○大将軍の特徴
　評価関数の作成に関しては、以下の点を工夫しています。
　（評価関数は、以下の2ステップの手順にて学習しています）　
　1.プロの棋譜からの学習
　　・いわゆるBonanzaメソッドをベースに、手番の評価やミニバッチの手法を取り入れています。
　　・ミニバッチを用いることで、学習が安定し、短時間で学習の成果を確認することができます。
　　・手番に関する評価は、3駒に手番加えたkkpt型を採用しています。kppt型よりも計算コストが小さいため、
　　　15%程度探索速度が向上します。
　2.自己の探索結果からの強化学習
　　・プロの棋譜からの学習において勝率が飽和したところで、浅い探索結果と深い探索結果の評価値を用いて、
　　　評価値の不整合を修正していきます。
　　・学習する局面により勝率に影響するようですが、とのように設定するとよいかは今後の課題です。

○ライブラリの使用
　やねうら王を使用しています。
　探索部分は基本的にライブラリを用い、開発は評価関数と学習に注力しています。