「習甦」 評価関数:以下の2項目で構成 1.駒の価値 ・盤面全体の駒の利きと持駒および手番から算出する玉の安全度に対応した非線形関数 2.駒の働き ・玉の筋および手番に対する玉以外の2駒の相対位置関係 機械学習:以下の2段階で学習 1.教師あり学習 ・棋譜の指し手と勝敗および読みを入れた評価値を教師データとするミニバッチ学習 2.強化学習 ・フィッシャーランダムチェスに準じたユニークな初期局面2494800からの自己対戦 ・割引報酬は自己対戦棋譜における評価値の推移をフィードバックして推定された勝率 ・古い世代の棋譜もミニバッチ学習におけるサンプリングの割合を減らしながら再利用