NDFを見習って手番を評価関数に加えてみました。 王の安全度と駒が取れるか、歩の利きの状態(利きが負けてる、勝ってる、歩受) に手番を追加しました。特に駒が取れるかどうか(ただ、同じ駒を取る、取ると得、利きが負けてる、勝ってる) 、は+50Eloぐらいの効果があったと思います。 手番の評価はNDFのような形ではなくて、銀と歩が向き合ってる形なら手番で分けてるだけです。 初期局面では手番の価値は+154、と結構大きな値になってます。 局面を反転、手番を反転させたときに対称にならないバグがいくつか見つかり修正しました。 進行度は歩切れだったら半分に、とか非線形だったのを、序盤は5手進めば+5%、 みたいにほぼ手数と同じになるように単純加算にしたら+30Eloぐらい効果がありました。 つまり、王の安全度だと、序盤、終盤、手番、で1つの特徴に4つの値を持っています。 合計で昨年から、自己対戦だと+130Elo、Bona6相手だと+80Elo程度の向上になっているようです。 学習はBonaメソです。 8000棋譜の学習だと手番評価は4000棋譜になって足りないようで16000棋譜は必要なようです。 評価関数のデータファイルは760KB、38万個ぐらいでかなり少ない部類かと思います。 3駒関係を使わずに3駒を超えることを目指しています。 クラスタは昨年とまったく同じGPS風クラスタの16台探索です。 実験だと16台から32台に増やしたとしても自己対戦で+50Eloぐらい(実質+30Eloぐらい?)しか上がらないようです。 使ったマシンは 予選がAmazon EC2の c3.8xlarge を16台で、決勝は c4.8xlarge を16台です。 5月4日 c3.8xlarge Xeon E5-2680 v2, 2.8GHz, 60GB, 16 core。これを16台で合計256コア、960GB 5月5日 c4.8xlarge Xeon E5-2666 v3, 2.9GHz, 60GB, 18 core。これを16台で合計288コア、960GB かかった費用は合計367時間で$650、78,000円ほどでした。 Stockfishの探索を参考にしています。 CSA例会 YSSの16台クラスタ探索について(2014年の情報) http://www32.ocn.ne.jp/~yss/csa0510.txt 古いですが基本的な解説は下記にあります。 「YSS 7.0」 --- そのデータ構造、及びアルゴリズムについて --- http://www32.ocn.ne.jp/~yss/book.html