最後の3行以外は去年のそのままです。 選択的探索を行っおり、手の生成の種類、数を残りの探索深さによって変えています。 また局面が終盤ならより少数の手しか生成しないようになっています。 探索の延長は反復深化法で前回の最善手を0.5手延長する、という手法を用いています。 評価関数はBonanza Methodを使っています。 YSSの探索ルーチンをそのまま使うと深さ2手読み程度ではほとんど手を生成しないので 遠くに打った金が動く手を読まない、など学習がいびつになっていました。 そのため、専用の全幅探索+簡易静止探索、で学習させています。 入玉は学習はまったくうまくいかない感じだったのでYSSの旧評価関数をそのまま組み込んでいます。 先手玉が4段目に上がれば+1500点ぐらい加算して、相手に入玉された場合には7段目から+加算を過激につけています。 評価関数の項目は王との2駒の関係や味方金銀の絶対位置による上部5箇所の駒、などGPS風の多数の組み合わせです。 これに序盤と終盤の進行度を使っています。進行度は学習なしです。サイズは22万個。 古いですが基本的な解説は下記にあります。 「YSS 7.0」 --- そのデータ構造、及びアルゴリズムについて --- http://www32.ocn.ne.jp/~yss/book.html 2013年はうまくいけば 激指の学習を試して Amazon EC2から8台ほど借りてGPS風のクラスタ並列をやろうと思ってます。 5/12に最終追記 などと書いてましたがAmazonEC2は16コア、HTいれて32スレッドの1時間2.7$のマシンを 借りようと思ったのですが、16スレッド動作ではほとんどnpsが上がらず、3.3GHzの 6コアに負けるので、利用は断念しました。ただ囲碁のAyaでは16スレッドまでは きれいに伸びていたのでYSSの並列化の問題と思われます。 学習も間に合わず。 結局、Stockfishの探索を参考にしたYssFishで参加しました。 GPSFISHのソースも大変参考になりました。ありがとうございます。 今までBona6に対して0.4の勝率が1手1秒で0.53.1手4秒で0.58、1手10秒で0.64?(400局)程度になるようです。 思考時間をかけたときの伸びが素晴らしいです。 2台のマシンを使っての楽観合議です。 歩の価値100(交換200)で標準偏差15の正規分布乱数を振ってます。乱数表のサイズは16384です。 合議でどのくらい強くなってたかは計測不明です。おそらく+40Elo程度だとは思います。