探索アルゴリズムは、局面の実現確率を打ち切り条件に利用することで、人 間のエキスパートの思考法と似た、狭くて深い探索を実現しています。局面 の遷移確率は、ロジスティック回帰モデルによって、盤面の局所パターン等、 様々な特徴量を利用して推定されています。探索の有効分岐数は、約2〜2.5 程度におさまっており、比較的短時間でも20手以上先の局面を読むことがで きます。 評価関数の学習には、平均化パーセプトロンをベースにした手法を用いてお り、高速な学習が可能になっています。探索の基本深さを6、棋譜数が5万、 繰り返し回数を5回とした学習が約24時間で完了します。 激指の実装および上記の手法の詳細は以下の文献に記述されています。 [1] 鶴岡 慶雅, 「激指」の最近の改良について―コンピュータ将棋と機械 学習―, 松原仁編, コンピュータ将棋の進歩6, 共立出版, 2012 [2] 横山 大作, 「激指」におけるゲーム木探索並列化手法, 人工知能学会 誌 Vol.26, No.6, pp. 648--654, Nov. 2011. [3] 鶴岡 慶雅,将棋プログラム「激指」,松原仁編, コンピュータ将棋の 進歩4, 共立出版, pp. 1-16, 2003 [4] Yoshimasa Tsuruoka, Daisaku Yokoyama, and Takashi Chikayama. Game-tree Search Algorithm based on Realization Probability. ICGA Journal, Vol. 25, No. 3, pp. 145-152, 2002