2台のマシンでの楽観合議を行う予定です。 選択的探索を行っおり、手の生成の種類、数を残りの探索深さによって変えています。 また局面が終盤ならより少数の手しか生成しないようになっています。 探索の延長は反復深化法で前回の最善手を0.5手延長する、という手法を用いています。 評価関数はBonanza Methodを使っています。 YSSの探索ルーチンをそのまま使うと深さ2手読み程度ではほとんど手を生成しないので 遠くに打った金が動く手を読まない、など学習がいびつになっていました。 そのため、専用の全幅探索+簡易静止探索、で学習させています。 入玉は学習はまったくうまくいかない感じだったのでYSSの旧評価関数をそのまま組み込んでいます。 先手玉が4段目に上がれば+1500点ぐらい加算して、相手に入玉された場合には7段目から+加算を過激につけています。 評価関数の項目は王との2駒の関係や味方金銀の絶対位置による上部5箇所の駒、などGPS風の多数の組み合わせです。 これに序盤と終盤の進行度を使っています。進行度は学習なしです。サイズは22万個。 古いですが基本的な解説は下記にあります。 「YSS 7.0」 --- そのデータ構造、及びアルゴリズムについて --- http://www32.ocn.ne.jp/~yss/book.html