探索アルゴリズムは、局面の実現確率を打ち切り条件に利用することで、人 間のエキスパートの思考法と似た狭くて深い探索を実現しています。ロジス ティック回帰モデルを利用して局面の遷移確率の推定を行うことで、探索の 有効分岐数は、約2〜2.5程度におさまっており、比較的短時間でも20手以上 先の局面を読むことができます。 評価関数の学習には、平均化パーセプトロンをベースにした手法を用いてお り、高速な学習が可能になっています。これにより、学習時に、比較的深い 探索(現在は基本深さ8)を行いながらパラメータの最適化を行うことが可 能になっています。 激指の実装および上記の手法の詳細は以下の文献に記述されています。 [1] 鶴岡 慶雅, 「激指」の最近の改良について―コンピュータ将棋と機械 学習―, 松原仁編, コンピュータ将棋の進歩6, 共立出版, 2012 [2] 横山 大作, 「激指」におけるゲーム木探索並列化手法, 人工知能学会 誌 Vol.26, No.6, pp. 648--654, Nov. 2011. [3] 鶴岡 慶雅,将棋プログラム「激指」,松原仁編, コンピュータ将棋の 進歩4, 共立出版, pp. 1-16, 2003 [4] Yoshimasa Tsuruoka, Daisaku Yokoyama, and Takashi Chikayama. Game-tree Search Algorithm based on Realization Probability. ICGA Journal, Vol. 25, No. 3, pp. 145-152, 2002